巧用互联网,以找到您最想要的信息:搜索思维作为基本功

  • 这里是您最基本应该掌握的使用互联网的小技巧,以便找到您最想要的内容和信息

5月下旬,英国政府的一名高级顾问公开宣称他 “早已” 在2019年就警告了冠状病毒的危险。

他在2019年3月4日撰写的博客文章中就显示了清晰的证据表明了该警告,文章中包括 “冠状病毒’’一词。

但是英国广播公司的一项调查显示,原始博客文章中并未写有 “冠状病毒” 一词,直到2020年4月9日大流行已经全面出现时,该警告才出现在那篇文章中。

验证这点非常容易,时光机就可以做到。就如英国广播公司首席互联网研究专家 Paul Myers 所说,现在有许多有效的工具和技术可以帮助公民和记者深入了解数字时代,比如在 Google街景视图中您可以浏览过去的场景。

6月,在为来自94个国家/地区的700多名记者组织的在线讲习班中,Myers 描述了一些开源调查工具、技巧和搜索技术,目标是发掘与 COVID-19 大流行相关的难以捉摸的信息、图像和社交媒体帖子。

这里讲述的方法都非常简单,就是说从开源情报技术中过滤出了那些最易于普及给零经验调查者的小技巧。但这些技巧都很实用,如果公民调查容易能熟练使用这些技巧,将足够应付大部分日常需求并验证一般的虚假信息。

比如,您知道在搜索中哪些情况下应该将关键词用 “” 扩起来吗?或者,在搜索句式中添加一个减号➖能过滤掉不需要的内容?再或者,您知道布尔搜索需要大写吗?再或者,您知道 “site:” 前缀可以将搜索重点放在您需要的特定域上吗?…… 等等。

上述这些是布尔搜索和 Googledorking 最基本的技巧,在下面看到具体介绍:

下面是一个演示:

再例如,尽管 Instagram 的搜索功能很差,但与其他社交媒体用户相比,其年龄较小的用户更可能标记自己的位置,于是那些在新闻事件中寻找在场人员(目击者)的调查人员就可以利用这点。

您可以通过使用词云来查找仅由目标社区使用的标签来专注于该社区/群体所发布的内容。

搜索思维是在线情报研究的基本资产。正如 Myers 所说,大多数人都使用自然语言搜索 Google —— 他们将其视为一个 “人”,有些时候有效,但是也有很多时候它会完全误解您的问题,因为谷歌真的不是人。它是算法,于是对于调查者来说,最好能使用算法听得懂的语言来和它交流。

只要你用得对,就能得到尽可能准确的结果。

Myers 提供了一个例子,比较著名的暗杀事件。如果你直接输入搜索词“Kennedy” and “Lennon”( 就是 John F. Kennedy 和 John Lennon),会触发一系列结果,包括英国足球队的网站。但是如果你加上 “Caesar” 一词,搜索就突然变成了暗杀比较。

这就是逻辑引导思考的最简单案例。

同样,在社交媒体上搜索目标个人时,如果您的调查目标是年轻人,那么搜索逻辑会快速告诉你应该从 TikTok 或 Instagram 等平台开始,而不是 LinkedIn,但如果你的目标是大公司的首席执行官,就如我们曾经演示的追踪政治旋转门的调查,那么肯定应该首先从 LinkedIn 开始。

再比如 Twitter,由于它有字符数限制,于是在 Twitter 发言的人们更多会使用缩写而不是完整的单词 —— “info” 出现的频率远超过 “information”,所以如果您在Twitter跟踪信息,请注意您的关键词使用,“information” 得到的结果将远低于 “info”。

Twitter 是跟踪突发新闻和群体事件的好地方,不论您是追踪名人、挖掘信息战网络、还是希望密切跟随新闻热点事件和抗议运动,这里都应该是您的首选。

也因此,对 Twitter 的挖掘工具和方法、工具和技巧,都非常多。我们介绍过其中大部分,也总结过一些简单易用的小功能,如下:

您可能早已意识到了,搜索是一切的基础;不论您是想要调查某件事、了解某些知识、追踪某些人、攻击某个组织/公司/机构 …… 第一步都是从搜索开始的。您能搜到的东西越多、越精准,您的行动就越顺利。

所以,搜索的技巧对几乎每个人来说都很重要,而不仅仅是公民调查人员。

Myers 在搜索技巧方面给出了一些最基本的建议。这些建议都非常简单,但是很重要,是大多数人容易犯的错误。

1、不要直接搜索您想要的东西。相反,搜索网页或社交媒体帖子中 **更有可能出现** 的单词;

2、不要忘了在单个关键字/词周围添加引号“”、给最有可能出现的不必要的内容添加减号➖,以进行更精准的过滤;

3、您可以通过在关键词选项之间以大写字母添加“ OR”来增加灵活性,并避免破坏搜索;

4、必要时,您可以将搜索集中到前缀为 “site:” 的特定域,注意没有空格:

5、您可以充分探索Google的选项、工具和高级搜索功能,包括日期范围,以进行更精准的过滤;

6、先找到确定会出现的词,然后找到 “可能” 会出现的词,避免遗漏重要内容;

7、在 archive.org 和 archive.is 上查找已删除的页面,尤其是社交媒体帖子。这一做法我们有过详细介绍:

8、ext:pdf 用来寻找pdf文件。搜索已经删除的文档时,请查找其缓存的版本。如果您知道该文档中的一些单词,请在Google中用引号将其扩起来,然后查看同一文档是否还有其他来源。

9、谷歌不是一切。例如有一些事 Bing 可以做到但是谷歌做不到,比如它允许您按IP地址而不是域名进行搜索。总之,您应该大致了解一些热门搜索引擎的特点,以便在您最需要的时候以您的需要为中心去选择它们

在社交媒体上查找信息的小技巧如下。

1、当然您有可能从外部进行搜索,比如用谷歌搜推文;但是也可以在特定平台上启动内部搜索,内部搜索的优势在于,它与平台自己的数据库直接连接,并且可以提供更多的最新结果;

2、如果您的调查目标是个人,请先尝试确定其电子邮件地址。电子邮件地址可能是唯一的标识,其效果通常两倍于社交媒体用户名,并且可以被诸如 Pipl.com 之类的找人数据库有效地使用。

基本方法如下:

3、在 email-format.com 格式中输入公司的名称,可能会找到目标人员电子邮件地址的公司格式。然后您就可以通过他们的名字找出他们的个人地址;

4、使用在线地图中自动生成的经度和纬度数字,可以找出特定社区中人们对某个特定主题的看法。将这些数字复制到 Twitter,不带空格前面添加 geocode:。然后将所需的地理半径添加到末尾,例如“ 1km”(一公里)。

下面是一个列表,是帮助您查找GPS/坐标的工具

epsg.io
coordinatesfinder.com
latitude.to
countrycoordinate.com
findlatitudeandlongitude.com
geody.com
getlatlong.net
mapcoordinates.net/en
gps-coordinates.org
gpscoordinates.info
gps-coordinates.net
gpscoordinates.eu/index.php
geoplaner.com
gpsvisualizer.com
gridreferencefinder.com
whatsmygps.com
maps.ie/coordinates.html

5、请记得每个平台都有些特殊性。比如,在 Instagram 的成功搜索往往带有下划线和复合词,而不是连字符。虽然无法从 Instagram 复制图像,但它们确实提供了可用于向前搜索的元信息;

6、Picbabun 是提供有效搜索 Instagram 的网站之一。它允许复制 Instagram 图片并以完整尺寸打开。

7、对调查者友好的网站 Echosec 将帮助您找到通过 Twitter 发送的 Instagram 帖子,其中搜索功能要好得多;

8、想要在推特上识别某些目标社区吗?Hashtagify.me 上的词云是个好办法,您能从中识别那些专属于目标社区使用的主题标签。例如,航空公司乘务人员使用的主要主题标签包括#crewlife,将其插入Twitter后立即能显示航空公司人员的帖子。

9、“intitle:” 也可以在是社交媒体平台内部搜索中使用,以显示含有特定单词的帖子;

10、如果您有预感目标人已经在 Facebook上对内容进行了后期编辑,请单击右上角的三个小点,查看 “编辑历史记录”,便可以找到以前的版本;

11、如果您怀疑整个帖子已经被修改了发布时间,请将光标悬停在 Facebook 帖子旁边的小时钟图标上,这将显示该帖子发布的真实日期:在下面看到操作案例演示:

12、使用 “url:” 可以找到带有指向其他网站的链接的 Twitter 帖子 —— 如果您正在寻找在亚马逊上出售口罩的人,那么就可以这样 url:amazon;

13、Followerwonk 允许您在 Twitter 中搜索人们的简介,但也可以找到两个不同帐户的共同关注者

14、尽管 Facebook 的搜索功能很笨拙,但它的确允许使用任何关键词(包括公司名)进行搜索,因此您可以在最初不知道其姓名的情况下搜索某人。

Facebook 的搜索技巧见下面的概括:

15、不要忘了,Facebook 还读取上传图像中的文字和数字,因此,您甚至可以搜索汽车牌照

16、如果受到 “最相关” 过滤器的限制,请在 “avoiding the filter bubble” 下搜索 Google。在调查过程中建议最好使用一个没有 “朋友/联系人” 也没有简介设置的袜子木偶账户。并清除Cookie,避免被反向追踪到您的身份。

17、一个非常高级但是不免费的搜索站点是 Social Links,它在 Maltego 内运行。可以说是物有所值的。您可以跨社交媒体他平台进行面部识别搜索;搜索标记的帖子或标记的照片。

Maltego 是个很厉害的东西,曾经是社交工程攻击的重要武器之一,对于调查人员来说,它的功能将让您感觉更加得心应手。在下面看到介绍和使用方法:

找人

在互联网上找人有几个步骤,从最显而易见的开始,逐渐深入 —— 如果您的调查对象比较擅长隐藏的话,您很可能需要多走几步。

1、第一步就是显而易见的,直接搜名字。用引号将名字扩起来。但是可能会有大量重名,如果您的调查对象不是名人的话。

2、第二步就是尝试布尔搜索。使用 OR 将可选关键字构建到搜索中。

例如对于夺走149人性命的空难,搜索“德国之翼” 9525航班的副驾驶员:

上面的搜索可以找到他的家乡以及他的名字或社交媒体用户名的页面。

3、使用 site: 指定域或URL的一部分。例如,将搜索集中在联邦航空局内部:

4、如果内容被大量删除过,那么就要首先考虑缓存。

如果信息只是最近才被删除的、并且仍然出现在Google搜索中,请尝试单击搜索结果中旁边的黑色小三角,也许能找到缓存副本。

5、如果没有缓存,就去档案馆/时光机上找。Archive.isWayback Machine 是最常用的。

6、目标人的同一张照片可能出现在许多不同的网站上,通常带有不同的标题。图像可以帮助您识别其中包含的人物的身份信息。单击Google图片搜索框中的相机图标,即可找到Google的反向图片搜索

7、由于姓名通常会有重名,有时同音字,因此最好收集尽可能多的有关目标人的信息包括社交媒体搜索中找到的任何信息

8、考虑下列问题。

关于名字 ——

  • 拼写正确吗?
  • 用户名是什么?
  • 婚后的姓氏?

关系 ——

  • 家人的名字可能会出 “朋友” 列表中
  • 人们有时会在不同的社交媒体平台上拥有一些相同的朋友

就业 ——

  • 他们做什么工作?
  • 他们为哪个公司服务?(服务不一定就是公开声明的工作)

相关的地点 ——

  • 他们在哪出生的?祖籍/家乡
  • 他们现在在哪工作或生活?

电邮地址 ——

  • 可以通过Skype、Whatsapp等地方找到目标人的详细信息
  • 可以通过 Email Format 之类的网站来推测目标人的工作电子邮件地址

电话号码 ——

  • 诸如 truecaller.comsync.me 之类的网站使您可以搜索数十亿个电话号码的数据库
  • 但是受到通用数据保护条例(GDPR)的限制,许多欧盟国家的号码很难找到

域名注册 ——

  • GDPR 也会阻止您查找域名的所有者
  • 但是一些旧的细节性信息仍然可以在 domaintools.com 之类的网站找到
  • 一些机构允许您提出查询请求
  • 一些注册公司的信息是公开的

此外也要考虑目标人的相貌特征、性格、兴趣爱好等

9、有一些在线资源已经将个人数据收集到可搜索的库中。例如 Lusha, contactout, jobjet 扽插件,可以提供您正在查看的帐户的联系方式。

Pipl Pro, Spokeo 等平台是专门搜人的站点,也许能提供有关您的调查对象的大量个人信息。可以通过电话号码、电子邮件和其他因素搜索 Pipl。 Spokeo在某些方面相似,但主要针对美国公民。

10、通过社交媒体搜人是必不可少的

  • Tweepsect 可以显示关注者、关注的人、和互粉关系
  • Followerwonk 可以比较两个或三个帐户的关注者,从而可能找到其中的团队关系或共同点
  • Tweetbeaver 包含很多有用的 Twitter 搜索工具
  • Facebook 的搜索框可以根据您想要的区域过滤 —— 比如帖子、人物、照片、视频、页面和群组
  • 群组和页面也有自己的内置搜索功能,可帮助您找到特定帖子
  • Facebook的 “People” 选项是其最有用的功能之一。您甚至都不需要搜索完整的名字,只需输入有关您正在寻找的人的一些详细信息。例如,您可以简单地搜索专业、公司、城镇或大学,您还可以在页面左侧找到过滤器,以指定与搜索相关的方面
  • Posts 选项使您可以搜索 Facebook 帖子中的关键字。筛选器允许您指定来源、日期和搜索的 Facebook 群组

最后

总之,如果您能掌握以上这些基本知识,日常的调查工作和信息验证工作就基本不成问题。

您不需要熟悉所有高端的技术操作、也不需要背下全套的工具列表,但是肯定应该掌握使用频率最高的一些技巧,并将它们纳入习惯。这样才能帮您在实践中得心应手。⚪️

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据