Google Hacking

基础技术

技术小贴
技术小贴

特殊字符

  • *:指代任意内容
  • + / -:强制(不)搜索+ / -后面的内容,不得有空格
  • "":强制搜索””内部包含的内容
  • ():Google对()不敏感,但可以帮助使用者明确搜索语法,如intext:(password|passcode) intext:(username|userid)intext:password | passcode intext:username | userid是相同的意思。

BOOL操作符

  • and:匹配and前后所有的参数
  • or:匹配搜索中的一个或另一个关键词,可用|代替
  • not:从查询词中忽略一个单词,可以使用-代替,如hacker -china

URL语法

类似于http://www.google.com/search?q="i hack stuff",我们可以通过直接修改URL达到搜索数据的目的。

Google的查询参数:

变量 说明
q或as_q 搜索查询 搜索查询,百度对应的参数为wd
as_eq 搜索关键字 将从搜索中排出的关键字
start 0到最大结果数 用于显示结果页面
num maxResults 1-100 每页显示的结果数
filter 0或1 如果filter为0,则可能显示重复的结果
restrict 限定代码 限定位与某个特定的国家的结果
hl 语言代码 描述显示结果所用的语言,如en|zh_CN
lr 语言代码 只显示这种语言的页面,如lang_ar
ie UTF-8 Web搜索的输入编码
oe UTF-8 Web搜索的输出代码
as_epq 搜索词组 这个值作为一个确切的词组进行提交,相当于””
as_ft i=包含的文件类型,e=排除的文件类型 用于包含或排除as_filetype指定的文件类型
as_filetype 文件扩展名 用于包含或排除as_ft指定的文件类型
as_qdr all:所有的结果,m3:过去3个月,y:过去一年 查找在指定时间范围内更新的网页
as_nlo 最小数 查找as_nlo和as_nhi之间的数
as_nhi 最大数 查找as_nlo和as_nhi之间的数
as_oq 词的列表 查找列表词汇中至少一个
as_occt any:网页中任何地方;title;body;url;links 在指定位置查找搜索关键字
as_dt i:仅包含站点或者域;e:不包含… 包含或排除由as_sitesearch指定的域或站点
as_search 域或站点 包含或排除由as_dt指定的域或站点
safe active:启动安全搜索;off:… 使用或禁用安全搜索
as_rq URL 查找与该URL类似的页面
as_lq URL 查找链接到该URL的页面
rights cc_* 用特殊的使用权限定位页面(政府、商业、非商业)

常见语言限定代码表:

lr语言代码 语言 lr语言代码 语言
lang_ar 阿拉伯语 lang_en 英语
lang_zh_CN 简体中文 lang_fr 法语
lang_zh_TW 繁体中文 lang_ja 日语

常见hl限定表:

hl语言代码 语言 hl语言代码 语言
zh_CN 简体中文 en 英语
xx-hacker 黑客语 ja 日语

常见restrict限定表:

国家 限定代码 国家 限定代码
澳大利亚 countryAU 加拿大 countryCA
中国 countryCN 英国 countryUK
日本 countryJP 法国 countryFR

如我们要显示来自日本的网页,其中包含hacker关键字,语言为日语,标签页使用英语描述:

http://www.google.com/search?restrict=countryJP&hl=en&lr=lang_ja&q=hacker

高级操作符

除了上述基本搜索技术外,Google还提供了称为高级操作符的关键字来辅助进行高级查询,如果没有在查询中使用高级操作符,那么谷歌会在网页内的所有地方搜索你的关键字,包括标题、文本和url等。

使用规范

和其它形式的标准Google查询相比,高级操作符必须遵守相当严格的语法规范。

  • 在操作符、冒号、搜索关键字之间是没有空格的;Google会把不符合规范的高级操作符当成另一个搜索关键字。
  • 高级操作符只对于紧跟其后的关键字有效。
  • 使用词组作为关键字的化,和基础搜索语法一样,需要使用””。
  • 布尔操作符和特殊字符仍可用于高级操作符查询。
  • 高级操作符和可以单独的查询混合使用。
  • 一次查询只能使用一次ALL操作符。

操作符表

名称 语法 描述 能否混用
intext intext:hacker “from china” 返回网页内容中包含hacker且网页任何地方含有from china的页面 yes
allintext allintext:hacker “from china” 返回网页的内容中包含后面所有关键字的页面 no
intitle intitle:”index of” private 返回标题包含index of,且网页任何地方有包含private的页面 yes
allintitle allintitle:”index of” private 返回标题中包含后面每一个词组或单词的页面,比intitle更精确 no
inurl inurl:admin index 返回URL中含有admin,且网页任何位置含有index的页面 yes
allinurl inurl:admin index 聪明的您,猜猜? no
site site:blackhat.com 查找指定域名的网页(从右往左) yes
filetype/ext filetype:doc | filetype:pdf 查找以特定文件扩展名结尾的网页,ext与filetype等价 yes
link link:www.k374.com 搜索链接到指定域名的网页 no
inanchor inanchor:登陆 搜索一个链接标记的锚点 yes
cache cache:blackhat.org 显式指定网页的缓存版本 no
numrange numrange:1-3或numrange 1..3 返回介于最小值和最大值之间的数,numrange独立于查询之外 yes
daterange daterange 2452164-2452164 “blackhat bin” 查找在某个特定日期范围内发布的网页 yes
info info www.baidu.com 显示出某个站点的摘要信息以及其他与该站点相关的链接 no
related related:www.baidu.com 显示和某个网站相关的站点 no
author author:Johnny或author:Johnny@gmail.com 搜索新闻组中所发表帖子的作者 yes
group group:*.forsale 在Google Groups帖子的标题中搜索含有关键字的帖子 yes
insubject insubject:hacker 与intitle返回一致的结果 yes
msgid msgid:xxx@yyy.com 通过消息id查找Groups帖子 no
stocks stocks:csc 搜索关于某个特定公司的股票信息,接股票简称,不能混用 no
define define:ironic 返回搜索关键字的定义,不能混用 no
phonebook phonebook Jhon Darling ny 搜索商业和住宅电话列表,此例返回Jhon Darling在New York的商业与住宅电话列表 no

注意事项

  1. 慎用allintitle类操作符,在和其他高级操作符一起使用时,它会打乱整个查询,从而无法得到结果,宁愿使用多个intitle代替之。
  2. inurl不支持搜索URL中的http://和特殊字符部分。
  3. 有趣的是:filetype:xls -xls理论上不应该返回结果,但事实却不一样。
  4. link操作符不能与其他操作符连用,如果后接无效的域名,如link:linux,则会把这个搜索当成一个词组,将冒号作为分割单词的标记。
  5. 类似的,cache:linux会返回和cache linux一样的结果。
  6. daterange后接日期范围,具体为据公元前4713年1月1日经过的天数。

Google Hacking

使用缓存实现匿名浏览

如果Google曾经抓取了某个网页,即使源文件现在已经不存在了,那么你仍然可能获得他的一个缓存副本,甚至在不需要给服务器发送任何一个单独的数据包就能够抓取你的整个网站。

然而,当我们访问这些缓存链接是,却不是匿名的,通过tcpdump抓包显示,我们所获取图片时却是直接从网站服务器而非Google服务器上下载的,这意味着当我们浏览Google的缓存网页来努力隐藏真实信息时,我们恰恰是在暴露自己!

tcpdump -Xx -s 500 -Cn

事实上,如果我们只浏览Google捕捉的缓存文本数据,这是我们不会和网站服务器发生任何交互,通常在缓存链接后添加以下参数:

&strip=1

浏览器就会自动转到缓存页面的文字版本了。

目录列表

来日方长,先写到这。

 

原创文章,作者:小嵘源码,如若转载,请注明出处:https://www.lcpttec.com/google-hacking/

(5)
上一篇 2019年9月26日 下午3:42
下一篇 2019年9月26日 下午4:06

相关推荐

  • C++

    数据类型 基本类型 类型 关键字 布尔型 bool 字符型 char 整型 int 浮点型 float 双浮点型 double 无类型 void 宽字符型 wchar_t 其实 wchar_t 是这样来的: typedef short int wchar_t; 需要注意的是: size_t 在 C 语言中就有了。 它是一种 整型 类型,里面保存的是一个整数,…

    2019年9月30日
    1.8K0
  • 推荐一款网络推广营销拓客的软件

    这次,小编来给大家推荐一款网络推广营销拓客的软件。希望对做网站推广的小伙伴们有所帮助哦。 为各位互联网营销及SEO站长朋友们推荐一款《站长拓客营销神器》,苦苦寻找很久终于给开发出来了,为网络营销从业者朋友解决双手,让获客成本和流量变成更加高效。 什么是“无忧拓客营销” 软件名称:无忧拓客营销工具,名字是我自己起的,帮助网站长们快速挖掘行业流量网站,拓展网站流…

    2019年12月15日
    2.4K0
  • 萌萌哒网络聊天室:Fiora聊天室安装与使用教程

    说明:Fiora是一款偏二次元的Web多人在线聊天应用,使用Node.js、Mongodb、Socket.io和React编写,使用起来还行,挺简洁的,这里水个搭建教程,有兴趣的可以玩玩。 截图 功能 好友,群组,私聊,群聊 文本,图片,代码,url等多种类型消息 贴吧表情,滑稽表情,搜索表情包 桌面通知,声音提醒,语音播报 自定义桌面背景,主题颜色,文本颜…

    2019年11月16日
    2.5K0
  • 关于BT服务器面板主题皮肤优化

    下面是 “关于宝塔服务器面板主题皮肤优化“ 的效果展示图,由娜云制作。小编只是转载。小编也希望大家用得开心,用得赏心悦目,以前那老土朴素的界面真的可以换一换皮肤了。 登陆界面 面板首页 文件管理 BTPanel 模板文件下载 使用方法: 1.解压覆盖到/www/server/panel/BTPanel/ 2.进入SSH,输入bt,选择9,清空面板缓存 3.清…

    2019年11月23日
    1.9K0
  • 嵌入式开发环境部署

    Why Openwrt openwrt基于linux,裁剪了Linux的文件系统,封装了适用于智能家居的功能模块。 搭建虚拟机 下载镜像:http://archive.openwrt.org/releases/17.01.4/targets/x86/64/lede-17.01.4-x86-64-combined-ext4.img.gz 转换工具:StarWi…

    2019年9月30日
    1.7K0
  • How to Make 图片马

    Copy命令制作 copy 1.png/b+1.php/a 2.png a 表示ascii文件 b 表示二进制文件 Cat命令制作 cat 1.png 1.php > 2.php 用于绕过getimagesize()函数的检查

    2019年9月26日
    1.5K0
  • Linux服务器VPS一键添加与删除Swap虚拟内存

    说明:很多人的VPS服务器由于内存太小,会导致很多进程被杀掉,这时候就需要我们添加Swap虚拟内存了,这里就整了个一键脚本方便懒人或小白使用。 脚本 提示:脚本不支持OpenVZ架构,安装会自动退出。 运行命令: wget https://www.moerats.com/usr/shell/swap.sh && bash swap.sh 然后…

    2019年11月16日
    2.7K0
  • Pwn入坑之栈基础(1)

    内存四区 代码区 .text 这个区域存储着被装入执行的二进制机器代码,处理器会到这个区域取指令执行。 数据区 .data 也叫静态区(static area),用于存储全局变量和静态变量和常量,程序结束后由系统释放。 分为初始化的全局变量、静态变量、常量和未初始化的全局变量、静态变量、常量。 堆区 通过malloc、free或new、delete等函数动态…

    2019年9月30日
    1.9K0
  • 插件机器人椎名真白(博客通用版)

    这次小编来介绍另外一款插件机器人:“插件机器人椎名真白(博客通用版)”。大家一起动手,把自己的博客装饰得更好看,更有趣吧。 关于Live2d的插件机器人椎名真白 在原先的基础上加上了如下功能:1.可以基于图灵机器人的聊天功能(需要自己写接口,默认隐藏)。2.能够随意移动并记录位置(关闭浏览器后失效)。3.能够随意唤醒或者关闭并记录状态。4.自动判断浏览器是否…

    2020年2月11日
    2.7K1
  • Windows安全之账号克隆

    账号策略 Windows中SID是标识用户、组和计算机账户的唯一号码。 使用工具getsid.exe进行获取管理员和普通用户的sid: D:>getsid \localhost administrator \localhost guest The SID for account administrator is S-1-5-21-1016001505-…

    2019年9月30日
    2.2K0
  • 仿站工具:一键就能下载网页模板

    这次,小编来给大家推荐一下 ”仿站工具“,”仿站工具“:一键就能下载网页模板。好使,方便,实用。 看到人家好看的网站主题模板想要怎么办?自己又不懂代码又不想花钱请人来写怎么办?接下来分享一个自用的“扒站神器”(单页面扒站工具)输入目标网站网址点击两下就可以把想要的模板网页下载下来。 平时自己收藏使用的免费分享给大家。 仿站工具 仿站(扒站)工具介绍 仿站小工…

    2019年12月15日
    2.5K0
  • 靶机渗透之HackInOS

    环境搭建 下载HackInOS 使用VirtualBox导入ovf,注意需要使用vbox导入 主机发现 本机ip: ​ 192.168.222.131 ip发现: arp-scan –interface=eth0 192.168.222.0/24 靶机ip: ​ 192.168.222.132 00:0c:29:9e:3a:be VMware, Inc. …

    2019年9月26日
    2.5K0