使用开源搜索引擎自定义您的互联网

  • 一切都发生在您的电脑上。您不会再受到算法暴政的操纵、也不会有监视资本家偷走您的数据

像 Google 这类搜索引擎显然是有效的;但是,出于隐私安全方面的考虑和保护免于被操纵的自由,或者因为您希望为互联网更加独立而做出贡献,您不会愿意使用 Google。

如果您是这样想的,那么可以考虑加入 YaCy,一个基于p2p的分布式开源免费的网页搜索引擎系统,任何人都可以用 YaCy 为自己建立个人的搜索门户,以实现信息的自由共享

opensource.com 介绍了这件事可以怎么做。

安装 YaCy

要安装并尝试 YaCy,请首先确保已安装 Java。如果您使用的是 Linux,则可以按照《How to install Java on Linux》的说明进行操作。如果您使用 Windows 或 MacOS,请从 AdoptOpenJDK.net 获取安装程序。

安装 Java 后,请下载适用于您的平台的安装程序

如果您使用的是 Linux,请解压缩 tarball 并将其移至 /opt 目录:

$ sudo tar — extract — file yacy_*z — directory /opt

根据下载的安装程序的说明启动 YaCy。

在 Linux 上:

$ /opt/yacy/startYACY.sh &

在网络浏览器中,导航到 localhost:8090 并搜索。

将 YaCy 添加到您的 URL 栏

如果您使用的是 Firefox Web浏览器,则只需点击几下,即可在 Awesome Bar 中将 YaCy 设为默认搜索引擎。

首先,将搜索栏显示在 Firefox 工具栏中(如果尚未显示)您不必使搜索栏保持可见;只需要激活它足够长的时间即可添加自定义搜索引擎。

导航至 localhost:8090,然后单击刚添加的 Firefox 搜索栏中的放大镜图标。单击选项将 YaCy 添加为您的 Firefox 搜索引擎。

完成此操作后,您可以在 Firefox 首选项中将其标记为默认,或者仅在 Firefox 搜索栏中执行的搜索中选择性地使用它。

P2P 搜索引擎如何工作

YaCy 是一个开源的分布式搜索引擎。它是用Java编写的,因此可以在任何平台上运行,并且可以执行Web爬网、索引和搜索。

这是一个对等(P2P)网络,整个网络是一个分散的架构,所有 peer 处于对等的地位,没有统一的中心服务器,每个 peer 独立地进行互联网的爬行抓取、分析及创建索引库,并通过p2p网络进行共享;而且每个 peer 又都是一个独立的代理服务器,能够对本机使用的网页进行索引,也通过本机运行的web服务器进行查询和返回结果。

它与 BitTorrent 非常相似(使用分布式哈希表/DHT),通过混合哈希表返回的结果,没人能知道是谁搜索了哪些单词,因此所有搜索在功能上都是匿名的。

YaCy 的防火墙设置

首次开始使用 YaCy 时,它可能在“初级”模式下运行。这意味着您的客户端爬网的站点仅对您可用,因为其他 YaCy 客户端无法访问您的索引条目。

要加入P2P体验,需要在路由器的防火墙中打开端口8090,也许还包括软件防火墙(如果正在运行的话)。这称为“高级”模式。

大多数路由器都提供了在防火墙中“戳洞”的选项,因为许多流行的联网游戏都需要双向流量。找到路由器防火墙的首选项后,将端口8090添加到白名单。例如这样:

如果路由器正在进行端口转发,则需要将传入流量转发到计算机的IP地址,使用相同的端口。例如:

如果由于某种原因无法调整防火墙设置也没关系,YaCy 将继续以初级模式运行作为一个P2P搜索网络的客户端。

自己的互联网

使用YaCy搜索引擎可以做的不仅仅是被动搜索。您可以强制抓取那些比较冷门的网站,可以请求对某个网站进行抓取,也可以选择使用 YaCy 进行本地搜索,等等。

简单说,您可以更好地控制您自己的互联网的外观。

安装只需三分钟。只需下载、解压缩该软件包并运行启动脚本即可。在 linux 上则需要 OpenJDK8。您不需要安装外部数据库或Web服务器,YaCy 中已包含所有内容。

在后台您能看到实时的爬虫情况,抓到了哪些结果、抓到了哪个网站、还有详细的可视化关系图谱。

除了个人电脑作为节点外,YaCy 也可以直接安装到服务器上,使用服务器不间断的抓取网站并向P2P网络共享搜索计算力和搜索结果,甚至可以直接绑定域名开展小型化的搜索服务。如果有资金,您还可以借此打造一个新的中文搜索引擎品牌,让百度失去主导地位,因为 YaCy 是开源的。

总之,高级用户越多,索引的网站就越多;所有用户的体验就越好。现在的状况是中文内容很少,因为中文用户太少了。所以,欢迎中文用户更多加入。⚪️

Customize your internet with an open source search engine

One thought on “使用开源搜索引擎自定义您的互联网

  1. 是的,这类搜索引擎有个很大问题就是中文。比如starpage搜不到贴吧的内容,而google可以,虽然理论上两者一样。

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据