如何快速从照片平台挖取重要信息?:开源情报工具推荐

  • 特别简单,适合初学者

我们提到过,照片和视频分享平台是最容易实现追踪的,因为在这些平台上,用户倾向于过多地暴露自己以赢取关注。追踪者就可以利用这点。

不论是 Instagram、tumblr、还是抖音,都会比 Twitter 更多暴露目标人的可追踪线索。

社交媒体情报是一个致命的问题,因为直到目前为止都没有有效的法律可以保护用户。

但是禁止一切挖掘也是不现实的,因为调查记者、NGO组织、人权组织、公民社会、公民自治团体等等,都在使用这种方法获取信息。

我们介绍这些挖掘方法的用意是**技术民主化** —— 不让这一能力仅仅掌握在权势手中,而是分享给更多公民,已满足当权者不想要满足我们的东西。

关于如何针对社交媒体挖掘情报的方法我们此前介绍过很多了,您可以在下面回顾其中一些:

真的有非常多,因为社交媒体情报是开源情报调查的重头戏。

对 Instagram 进行开源情报调查的工具也有很多,其中 Jake Creps 介绍的 InstaLoader 的确是很不错的一种。它在提供大量数据的同时又可以保持用户友好性。您可以在这里看到原文《InstaLoader – an OSINT Tool for Scraping Instagram Metadata

InstaLoader 执行以下操作

  • 下载公开的和私有的个人信息、标签、用户故事、提要和保存的媒体;
  • 下载每个帖子的评论、地理标记和标题;
  • 自动检测个人资料名称是否有更改,并相应地重命名目标(也就是说目标即便改了名字也可以继续追踪);
  • 允许您对过滤器以及存储下载的媒体的位置进行精细的自定义。

InstaLoader 可让您提取主题标签、用户发布的内容、提要、标题、和保存的媒体。这是进行社交媒体调查的基础。

👉这些信息很重要,追踪者和调查人员可以基于这些信息结合更多公开信息,以掌握目标人的几乎一切。

接下来,您可以下载每个帖子的评论和地理标记。每个帖子的评论都是线索,我们绝大多数人不会在网上无缘无故地给他人留评论对吧?于是对于追踪者来说,每一个评论都意味着 “下一条线索”。

👉 如果用户对个别评论有真实的反应,那么你就可以 “透视” 该个人资料,并重复 InstaLoader 流程以构建您的调查网络。

您可以潜在地从目标个人资料发现外部用户的活动。关于这一点,我们可以先讨论一个调查 Instagram 的独特问题。

关于 Instagram

对开源情报调查人员来说,Instagram 存在一个问题,例如 Twitter 之类的其他社交媒体则没有这样的问题 —— 即:您无法在其个人资料页面之外看到用户活动。

也就是说,您可以看到用户发布的内容,但是无法搜索他们与之交互的其他内容。显然,这在识别欺诈、僵尸网络帐户、潜在的人口贩子等目标的时候,就会出现问题

没办法,它就是这么设计的。由于这个问题,您需要获取尽可能多的数据,才能编写有效的报告并得出合理的结论。

通过分析用户生成的内容下的评论来进行延展调查,是一种解决方案。

另一种方法是分析用户遵循的主题标签,以查找外部活动,该主题是公开可用的。一旦找到另一个与之交互的个人资料,就可以在该个人资料中搜索更多信息。

下面具体说说这个工具。

InstaLoader 设置

InstaLoader 是我使用过的最简单的工具之一。设置仅两个步骤:

$ pip3 install instaloader

$ instaloader profile [profile ...]

仅此而已。由于它位于 PyPi 上,因此您可以使用 pip 进行安装,即可开始使用。这里没有更多要说的。这是该工具资料的链接

用例

作为一般免责声明:您绝不应该出于恶意或令人毛骨悚然的原因使用 InstaLoader。

与大多数工具一样,好人和坏人都可以使用它来谋取私利。你别做坏人!

👉我们介绍所有工具都是帮助您防御的,最好的情况下是帮助没有民主经验的社会尝试民主化实践 —— 构建公民自己的调查社区,绝不是让您侵犯他人的。否则,您会被抓住,不开玩笑。

在更高的技术水平上,您可以使用 InstaLoader 提取数据、生成档案、进行链接分析等等。

这里是可以永久使用 Instaloader 的几种方法。

在有关尼日利亚王子骗局的文章中,就使用了 InstaLoader 来证明一个帐号不是他们所说的帐号。

因为该帐户现在已删除,所以这里简单介绍一下背景。

一个声称自己是尼日利亚埃米尔王子的账户说服人们购买加密货币,这是个骗局,该欺诈账户使用了该王子的照片,以便让人们信服。

第一步是确定他们冒充了哪个王子,然后证明他们是欺诈行为。

为此,调查确定了王子被使用的所有照片都是公开的 —— 使用 InstaLoader 下载照片和元数据,并使用反向图像搜索和 Google Dorks 查找发布照片的文章。在下面看到:

发现第一个危险信号。接下来就能够使用与该帐户有关的相同语言来查找多个帐户,以解决这个加密货币骗局。

这只是您可以处理 InstaLoader 提取的信息的一个示例。显然,它可以做很多事。

开源情报洞察力

InstaLoader 可能是最强大的 Instagram 开源情报调查工具之一。

尽管我喜欢它的所有功能和自定义功能,但文件输出的格式确实存在点问题。

我敢肯定这是可以调整的,但也是为什么在人脸识别的演示中使用了 Instalooter 而不是 InstaLoader。

更具体地说,不是将所有照片都转储到一个文件夹中,而是每张照片都有其自己的带有元数据的文件夹。这对组织非常有用,虽然也有点累。

由于 Instagram 由 Facebook 拥有,因此 Instagram 将来可能会收到类似的隐私保护措施;因此,很可能使 InstaLoader 之类的工具获得成功。

此外,普通用户可能会转向私有帐户,从而限制了挖掘工具的使用。这些问题都要考虑到。

在围绕Web抓取工具(例如 InstaLoader)构建基础结构之前,请牢记这些注意事项。⚪️

InstaLoader – an OSINT Tool for Scraping Instagram Metadata

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据