绕开推特算法噪音、使用基本运算符挖掘推特数据的方法

  • 避免被算法操纵的技巧可以很简单;本文还将补充挖掘推特情报的方法,本文是基础知识,帮助您快速找到想要的资源!

2019年7月,Twitter对其界面,搜索URL和整体用户体验进行了一些更新。

他们在后台更改了许多内容,这使得开源调查人员的体验变得很糟糕。

本文将采取一些基本步骤来帮助您恢复“旧” 的 Twitter 用户体验,就像您以前那样。并且,还可以帮助您通过 Twitter 过滤掉自动生成的算法噪音(例如:建议的推文和推荐的帐户),并向您展示如何执行基本的手动搜索 —— 您可以根据需要进行更复杂的设置,以便更好的挖掘到想要的东西。

消除算法噪音

像所有其他社交媒体平台一样,Twitter使用算法为您呈现所谓的“最佳”结果。“最佳”结果是基于许多不同的因素得出的,例如 您的关注者、关注您的人、以及活动历史记录等等 —— 是的,它一直在监视你。

Twitter 甚至会为您提供回溯,这是为了确保您在睡觉时没有错过任何内容。

但是,⚠️这些排名和算法会影响并模糊您的时间轴 —— 我们认为这是算法操纵,使您无法按时间顺序查看实际发生的情况。

尤其是对调查人员来说,当您设置了特定的 Twitter 帐户来侦查其他 Twitter 帐户时,算法操纵就是您必须防止的事。

对普通人来说也是如此。例如,您设置了一个 Twitter 帐户,以跟踪一组专门挑选的新闻媒体,以防漏掉发生的任何重大新闻事件。

在这种情况下,您肯定不希望 Twitter 算法去为您决定应显示哪些推文、以及以什么顺序显示,而不是显示真正的全部由你亲自从中选取需要的东西。

对使用特定帐户进行侦查时,您会希望信息以“无偏见”的形式按时间顺序排列。

💡要解决此问题,您需要采取一些步骤。设置好之后,您会发现,您的 Twitter 时间轴更加整洁了,并且按时间顺序排列

以下步骤向您展示如何消除“算法产生的 Twitter 噪音

1、打开 Twitter 并登录到您的账户 —— 不论是个人账户、工作账户、还是袜子木偶账户;在这里回顾《如何建立一个匿名社交媒体账户以保护个人数据的私密性?》。

2、单击左侧菜单中的三个点

3、点击“设置和隐私”

4、点击“内容偏好设置”

5、点击“静音”

6、点击“静音词”

7、点击“ +”图标

8、一对一添加参数(有关参数列表,请参见屏幕截图下面)

参数是这样的:

  • suggest_recap
  • suggest_who_to_follow
  • suggest_activity
  • suggest_activity_tweet
  • suggest_recycled_tweet_inline
  • suggest_recycled_tweet
  • suggest_grouped_tweet_hashtag
  • suggest_sc_tweet
  • suggest_pyle_tweet
  • suggest_ranked_timeline_tweet
  • suggest_ranked_organic_tweet
  • generic_activity_highlights
  • generic_activity_momentsbreaking
  • ActivityTweet
  • RankedOrganicTweet

添加完参数后,您应该会看到以下这样的内容:

搜索查询以获取排斥掉算法操纵的结果

在推特搜索: filter:follows -filter:replies 单击“最新”选项卡结果,也会为您显示非算法操纵的 Twitter 时间轴。

您甚至可以通过在上面的搜索查询中添加 -filter:RT 来进一步过滤掉转发。

退回到“旧版” Twitter 的方法

另一个建议是在浏览器中使用 extension/addon,将您的 Twitter 反向推回到“旧”版本的 Twitter。

它实际上将您的浏览器的用户代理更改为较旧的浏览器之一:例如:Mozilla/5.0 (Windows NT 9.0; WOW64; Trident/7.0; rv:11.0) 如 Gecko。

由于 Twitter 会监听您的浏览器,因此该插件将使其看起来像是您在使用一个非常旧的浏览器,于是 Twitter 会自动向您展示一个较旧的 Twitter 版本(使用较少的资源)。

Chrome 的旧版 Twitter 扩展

https://chrome.google.com/webstore/detail/goodtwitter/jbanhionoclikdjnjlcmefiofgjimgca

适用于 Firefox 的旧版 Twitter 插件

https://addons.mozilla.org/en-GB/firefox/addon/goodtwitter/

源代码可以在这里找到:

https://github.com/ZusorCode

使用搜索运算符搜索 Twitter

我们介绍过一些运算符的使用方法,见《从推特中挖掘真相不需要太复杂的工具:一个常用工具的全面指南》。

完成以上所有设置后,您始终可以手动搜索 Twitter 来进行更深入的挖掘。

处理开源情报案例时,重要的是要了解或至少熟悉该平台的本地搜索运算符。当然,您可以使用(自动)工具搜索 Twitter,以找到针对您特定研究问题的答案。

但是,通常最好的是手动执行此操作,尤其是在您的调查报告必须详细解释和概述如何找到该信息的情况下。

除了上面关联的文章之外,在下面,您将找到一组示例搜索运算符。您可以使用这些示例来大致了解 Twitter 必须提供的搜索选项。

一旦您熟悉了基础知识,就可以通过组合查询使搜索尽可能有针对性地扩展范围。我喜欢称其为“查询杂耍”。

不要忘记点击 “latest” 标签以查看最新结果,因为默认情况下它将指向 “top results”。很多时候和 GoogleDorking 很像,您可以在这里看到《GoogleDorking 高级运算符完整列表》。

  • “Hongkong” :包含确切的短语 “Hongkong” 的所有内容;
  • Hongkong OR China:包含“Hongkong”或“China”,或两者;
  • osint -tool:包含 “osint”,但不包含 “tool”;
  • #Hongkong:包含 #Hongkong 标签的所有内容;
  • from:iyouport_news:从 Twitter 用户 “iyouport_news” 发送的内容;
  • to:iyouport_news : 发送给推特用户 “iyouport_news” 的内容;
  • @iyouport_news :指 Twitter 用户 “ @iyouport_news ”;
  • party source:Facebook :通过 Facebook 发送的包含“ party”一词的内容;
  • osint ? :包含 “osint”一词,并且提了一个问题的推文;
  • “mass shooting” near:”NYC” :包含确切的词组“大规模射击”,并在“纽约市”附近发送的内容(请注意,只有不到8%的 Twitter用户启用了地理位置推文功能。因此,这些结果可能并非您所期望的那么丰富);
  • Hongkong filter:links :包含 “Hongkong” 并链接到网址的内容;
  • near:Chicago within:15mi :在距离“芝加哥” 15英里范围内发送的内容;
  • geocode:51.917058, 4.473365,1km :在x、y坐标的1km半径内发送的内容;
  • Hongkong since:2019–07–29 :日期“ 2019–07–29”开始的包含“Hongkong”的内容;
  • Hongkong until:2014–11–04 :包含 “Hongkong”的内容直到日期“ 2014–11–04”;
  • Hongkong lang:fr :包含用法语写的“Hongkong”一词的内容;
  • Hongkong filter:images :包含单词 “Hongkong”,并在推文中包含图片的内容;
  • Hongkong filter:media :包含单词 “Hongkong”,并在该推文中包含图片或视频的内容;
  • Hongkong min_retweets:8 :包含“Hongkong”一词,并至少进行过8次转发的内容;
  • Hongkong min_faves:8 :包含 “Hongkong” 一词,并至少被点赞了8次的内容。

Twitter 在2019年7月进行了一些界面更改。随着这些更改,基本搜索的URL发生了变化。

曾经是 https://www.twitter.com/searchhttps://www.twitter.com/explore 的那些已被重定向到了https://www.twitter.com/search-home

仍可在 https://twitter.com/search-advanced 上找到Twitter界面高级搜索。

您也可以将定期搜索保存为书签,这样可以节省一些时间。

您还可以更改url参数来更改搜索。范例:https://twitter.com/search?q=osintcurious%20webcast&src=typed_query&f=live 搜索带“ osintcurious” 同时网络直播的内容,您可以操纵url中的单词来更改搜索,然后按 Enter。

在这里是,把 “webcast” 改为 “guest”,变成这样: https://twitter.com/search?q=osintcurious%20guest&src=typed_query&f=live

就是这样!

这就是在避免所有 Twitter 产生的算法噪音、并收回干净的时间顺序的情况下,设置 Twitter 帐户的基础知识。

本文指出了您可以执行的所有基本搜索。当然,还可以有超出基本搜索选项的更多高级提示和技巧,如果您感兴趣的话今后我们会慢慢介绍。

您也可以分享您自己挖掘到的技巧和窍门,通过下面的评论栏。很高兴与您交流!玩得开心。⚪️

One thought on “绕开推特算法噪音、使用基本运算符挖掘推特数据的方法

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据