Google Hacking

基础技术

技术小贴
技术小贴

特殊字符

  • *:指代任意内容
  • + / -:强制(不)搜索+ / -后面的内容,不得有空格
  • "":强制搜索””内部包含的内容
  • ():Google对()不敏感,但可以帮助使用者明确搜索语法,如intext:(password|passcode) intext:(username|userid)intext:password | passcode intext:username | userid是相同的意思。

BOOL操作符

  • and:匹配and前后所有的参数
  • or:匹配搜索中的一个或另一个关键词,可用|代替
  • not:从查询词中忽略一个单词,可以使用-代替,如hacker -china

URL语法

类似于http://www.google.com/search?q="i hack stuff",我们可以通过直接修改URL达到搜索数据的目的。

Google的查询参数:

变量 说明
q或as_q 搜索查询 搜索查询,百度对应的参数为wd
as_eq 搜索关键字 将从搜索中排出的关键字
start 0到最大结果数 用于显示结果页面
num maxResults 1-100 每页显示的结果数
filter 0或1 如果filter为0,则可能显示重复的结果
restrict 限定代码 限定位与某个特定的国家的结果
hl 语言代码 描述显示结果所用的语言,如en|zh_CN
lr 语言代码 只显示这种语言的页面,如lang_ar
ie UTF-8 Web搜索的输入编码
oe UTF-8 Web搜索的输出代码
as_epq 搜索词组 这个值作为一个确切的词组进行提交,相当于””
as_ft i=包含的文件类型,e=排除的文件类型 用于包含或排除as_filetype指定的文件类型
as_filetype 文件扩展名 用于包含或排除as_ft指定的文件类型
as_qdr all:所有的结果,m3:过去3个月,y:过去一年 查找在指定时间范围内更新的网页
as_nlo 最小数 查找as_nlo和as_nhi之间的数
as_nhi 最大数 查找as_nlo和as_nhi之间的数
as_oq 词的列表 查找列表词汇中至少一个
as_occt any:网页中任何地方;title;body;url;links 在指定位置查找搜索关键字
as_dt i:仅包含站点或者域;e:不包含… 包含或排除由as_sitesearch指定的域或站点
as_search 域或站点 包含或排除由as_dt指定的域或站点
safe active:启动安全搜索;off:… 使用或禁用安全搜索
as_rq URL 查找与该URL类似的页面
as_lq URL 查找链接到该URL的页面
rights cc_* 用特殊的使用权限定位页面(政府、商业、非商业)

常见语言限定代码表:

lr语言代码 语言 lr语言代码 语言
lang_ar 阿拉伯语 lang_en 英语
lang_zh_CN 简体中文 lang_fr 法语
lang_zh_TW 繁体中文 lang_ja 日语

常见hl限定表:

hl语言代码 语言 hl语言代码 语言
zh_CN 简体中文 en 英语
xx-hacker 黑客语 ja 日语

常见restrict限定表:

国家 限定代码 国家 限定代码
澳大利亚 countryAU 加拿大 countryCA
中国 countryCN 英国 countryUK
日本 countryJP 法国 countryFR

如我们要显示来自日本的网页,其中包含hacker关键字,语言为日语,标签页使用英语描述:

http://www.google.com/search?restrict=countryJP&hl=en&lr=lang_ja&q=hacker

高级操作符

除了上述基本搜索技术外,Google还提供了称为高级操作符的关键字来辅助进行高级查询,如果没有在查询中使用高级操作符,那么谷歌会在网页内的所有地方搜索你的关键字,包括标题、文本和url等。

使用规范

和其它形式的标准Google查询相比,高级操作符必须遵守相当严格的语法规范。

  • 在操作符、冒号、搜索关键字之间是没有空格的;Google会把不符合规范的高级操作符当成另一个搜索关键字。
  • 高级操作符只对于紧跟其后的关键字有效。
  • 使用词组作为关键字的化,和基础搜索语法一样,需要使用””。
  • 布尔操作符和特殊字符仍可用于高级操作符查询。
  • 高级操作符和可以单独的查询混合使用。
  • 一次查询只能使用一次ALL操作符。

操作符表

名称 语法 描述 能否混用
intext intext:hacker “from china” 返回网页内容中包含hacker且网页任何地方含有from china的页面 yes
allintext allintext:hacker “from china” 返回网页的内容中包含后面所有关键字的页面 no
intitle intitle:”index of” private 返回标题包含index of,且网页任何地方有包含private的页面 yes
allintitle allintitle:”index of” private 返回标题中包含后面每一个词组或单词的页面,比intitle更精确 no
inurl inurl:admin index 返回URL中含有admin,且网页任何位置含有index的页面 yes
allinurl inurl:admin index 聪明的您,猜猜? no
site site:blackhat.com 查找指定域名的网页(从右往左) yes
filetype/ext filetype:doc | filetype:pdf 查找以特定文件扩展名结尾的网页,ext与filetype等价 yes
link link:www.k374.com 搜索链接到指定域名的网页 no
inanchor inanchor:登陆 搜索一个链接标记的锚点 yes
cache cache:blackhat.org 显式指定网页的缓存版本 no
numrange numrange:1-3或numrange 1..3 返回介于最小值和最大值之间的数,numrange独立于查询之外 yes
daterange daterange 2452164-2452164 “blackhat bin” 查找在某个特定日期范围内发布的网页 yes
info info www.baidu.com 显示出某个站点的摘要信息以及其他与该站点相关的链接 no
related related:www.baidu.com 显示和某个网站相关的站点 no
author author:Johnny或author:Johnny@gmail.com 搜索新闻组中所发表帖子的作者 yes
group group:*.forsale 在Google Groups帖子的标题中搜索含有关键字的帖子 yes
insubject insubject:hacker 与intitle返回一致的结果 yes
msgid msgid:xxx@yyy.com 通过消息id查找Groups帖子 no
stocks stocks:csc 搜索关于某个特定公司的股票信息,接股票简称,不能混用 no
define define:ironic 返回搜索关键字的定义,不能混用 no
phonebook phonebook Jhon Darling ny 搜索商业和住宅电话列表,此例返回Jhon Darling在New York的商业与住宅电话列表 no

注意事项

  1. 慎用allintitle类操作符,在和其他高级操作符一起使用时,它会打乱整个查询,从而无法得到结果,宁愿使用多个intitle代替之。
  2. inurl不支持搜索URL中的http://和特殊字符部分。
  3. 有趣的是:filetype:xls -xls理论上不应该返回结果,但事实却不一样。
  4. link操作符不能与其他操作符连用,如果后接无效的域名,如link:linux,则会把这个搜索当成一个词组,将冒号作为分割单词的标记。
  5. 类似的,cache:linux会返回和cache linux一样的结果。
  6. daterange后接日期范围,具体为据公元前4713年1月1日经过的天数。

Google Hacking

使用缓存实现匿名浏览

如果Google曾经抓取了某个网页,即使源文件现在已经不存在了,那么你仍然可能获得他的一个缓存副本,甚至在不需要给服务器发送任何一个单独的数据包就能够抓取你的整个网站。

然而,当我们访问这些缓存链接是,却不是匿名的,通过tcpdump抓包显示,我们所获取图片时却是直接从网站服务器而非Google服务器上下载的,这意味着当我们浏览Google的缓存网页来努力隐藏真实信息时,我们恰恰是在暴露自己!

tcpdump -Xx -s 500 -Cn

事实上,如果我们只浏览Google捕捉的缓存文本数据,这是我们不会和网站服务器发生任何交互,通常在缓存链接后添加以下参数:

&strip=1

浏览器就会自动转到缓存页面的文字版本了。

目录列表

来日方长,先写到这。

 

原创文章,作者:小嵘源码,如若转载,请注明出处:https://www.lcpttec.com/google-hacking/

(5)
上一篇 2019年9月26日 下午3:42
下一篇 2019年9月26日 下午4:06

相关推荐

  • Pwn入坑之栈基础(1)

    内存四区 代码区 .text 这个区域存储着被装入执行的二进制机器代码,处理器会到这个区域取指令执行。 数据区 .data 也叫静态区(static area),用于存储全局变量和静态变量和常量,程序结束后由系统释放。 分为初始化的全局变量、静态变量、常量和未初始化的全局变量、静态变量、常量。 堆区 通过malloc、free或new、delete等函数动态…

    2019年9月30日
    2.1K0
  • 萌萌哒网络聊天室:Fiora聊天室安装与使用教程

    说明:Fiora是一款偏二次元的Web多人在线聊天应用,使用Node.js、Mongodb、Socket.io和React编写,使用起来还行,挺简洁的,这里水个搭建教程,有兴趣的可以玩玩。 截图 功能 好友,群组,私聊,群聊 文本,图片,代码,url等多种类型消息 贴吧表情,滑稽表情,搜索表情包 桌面通知,声音提醒,语音播报 自定义桌面背景,主题颜色,文本颜…

    2019年11月16日
    2.7K0
  • 现今的免备案VPS服务器哪个商家的比较好呢?

    现在的免备案VPS服务器哪个商家的比较好呢?这次,小编就围绕这个话题来给大家推荐一些免备案VPS主机吧,希望对于各位站长或者新手站长有所帮助。 免备案VPS主机哪家最好?免费推荐国外VPS服务器产品。当今服务器厂商鱼龙混杂,网站长很难选择正确且可靠的服务器产品,尤其是免备案服务器如果不懂技巧很容易掉进垃圾服务器的坑。本文为站长们罗列并推荐国内外免备案主机服务…

    2019年12月15日
    3.0K0
  • 靶机渗透之突破fbi

    学习目的 信息收集 漏洞挖掘 impress cms 流量分析 突破Tomcat后台 Getshell 权限提升 持久控制 环境配置 下载链接:https://pan.baidu.com/s/1hN7dxPKkkrqhg9Q6I-s9yg 网络配置:使用默认的桥接模式即可! 主机发现 ➜ ~ netdiscover -i eth1 -r 192.168.1….

    2019年9月30日
    2.4K0
  • 关于图片优化:免费图片压缩工具下载

    这次,小编给大家带来的是 ”关于图片优化:免费图片压缩工具下载“。希望对大家做SEO优化的小伙伴们有所帮助,希望能提升小伙伴们网站的打开与读取速度哈。 分享一个免费图片压缩工具软件,压缩图片大小体积质量不缩水。 这款名叫:瑞影无损图片压缩大师V1.4 中文汉化版压缩工具,可以无损批量压缩图片。 对图片压缩有需求的朋友可以下载使用。   网盘地址:h…

    2019年12月15日
    2.0K0
  • PSKHOSTING:国外黑色星期五主机空间1$一年

    外贸建站推荐 PSKHOSTING:国外黑色星期五主机空间1$一年 国外黑色星期五主机空间1$一年 5 GB共享主机(1$); 可绑定1个域名 2个数据库 5 GB储存空间 150 GB每月传输 无限的FTP帐户 1个电子邮件帐号 购买地址:https://clients.pskhosting.com/cart.php?a=add&pid=115 6…

    2019年11月30日
    2.1K0
  • 国外VPS购买推荐帖子:HOSTSAILOR

    便宜的vps服务器能发财致富呢!国外服务器供应商HOSTSAILOR:服务器vps黑色星期五优惠价格,只需要6.6$一年哦!本方法由峰哥博客提供。工具:谷歌浏览器+谷歌浏览器上面的谷歌自动翻译。(谷歌翻译英文嘛,但博主英文好,是不需要翻译英文的,啊哈哈哈哈哈) 需要的可以上车,6.6$一年目前还有库存,无需优惠码直接购买即可! 这家除了线路比较烂其他都可以!…

    2019年11月30日
    1.9K0
  • CTF-PWN 环境配置

    pwntools sudo apt install python-pip python3-pip sudo pip install pwntools 提示安装python-dev可以使用aptitude安装 这一步建议挂代理 python >>> import pwn >>> pwn.asm(“xor eax,eax”) …

    2019年9月26日
    2.8K0
  • Linux内核编程之Makefile

    总述 Makefile是一个文本形式的数据库文件,其中包含一些规则来告诉make处理哪些文件以及如何处理这些文件。这些规则主要是描述目标文件是从哪些别的依赖文件中产生的,以及用什么命令来执行这个过程。 执行make命令时,需要一个 Makefile 文件,以告诉make命令需要怎么样的去编译和链接程序。 它会对磁盘上的文件进行检查,如果目标文件的生成或被改动…

    2019年9月26日
    1.4K0
  • About A Blog

    博客的搭建 环境安装 安装git 安装node.js 安装hexo ​ npm install -g hexo-cli 测试是否成功安装 $ hexo -v hexo: 3.4.2 生成博客雏形 cd进入一个博客的目录,如D:My Blog 初始化博客 ​ hexo init hexo会将这个文件夹初始化成一个博客专用文件夹,生成过程稍微要点时间,耐心等待。…

    2019年9月30日
    2.0K0
  • 推荐一款网络推广营销拓客的软件

    这次,小编来给大家推荐一款网络推广营销拓客的软件。希望对做网站推广的小伙伴们有所帮助哦。 为各位互联网营销及SEO站长朋友们推荐一款《站长拓客营销神器》,苦苦寻找很久终于给开发出来了,为网络营销从业者朋友解决双手,让获客成本和流量变成更加高效。 什么是“无忧拓客营销” 软件名称:无忧拓客营销工具,名字是我自己起的,帮助网站长们快速挖掘行业流量网站,拓展网站流…

    2019年12月15日
    2.6K0
  • Linux背景知识

    操作系统 体系结构 控制器:CPU,读取系统指令 运算器:CPU,运算 储存器:RAM(内部存储器:易失性存储器) 输入设备:输入数据 输出设备:显示命令执行结果 总线结构 地址总线:负责内存寻址 数据总线:负责传输数据 控制总线:负责控制指令 基本背景 前世 1969年,一群MIT BELL Lib 的家伙用汇编语言开发出一款收费操作系统:MULTICS …

    2019年9月30日
    1.9K0