[AI Perplexica] AI驱动的开源搜索引擎

简介: 探索Perplexica,一款由AI驱动的开源搜索引擎,了解其特点、使用方法以及如何安装。

之前,我们有介绍过 Perplexcity

现在,开源市场上,也有一款对标产品 Perplexica ,我们来看下

perplexica

界面很像

介绍

Perplexica是一个开源的、由AI驱动的搜索工具或搜索引擎,它深入互联网寻找答案。受到Perplexity AI的启发,它是一个开源选项,不仅仅搜索网络,而且理解你的问题。它使用先进的机器学习算法,如相似性搜索和嵌入,来精炼结果,并提供带有引用来源的清晰答案。

使用SearxNG保持最新且完全开源,Perplexica确保你总是获得最新信息,同时不牺牲你的隐私。

特点

  • 本地LLMs:你可以使用Ollama来利用本地LLMs,如Llama3和Mixtral。
  • 两种主要模式
    • Copilot模式:(开发中)通过生成不同的查询来增强搜索,找到更多相关互联网资源。与仅使用SearxNG的上下文进行普通搜索不同,它会访问最匹配的页面,并尝试直接从页面找到与用户查询相关的内容。
    • 普通模式:处理你的查询并执行网络搜索。
  • 焦点模式:特定模式,更好地回答特定类型的问题。Perplexica目前有6种焦点模式:
    • 全模式:搜索整个网络,找到最佳结果。
    • 写作助手模式:有助于不需要网络搜索的写作任务。
    • 学术搜索模式:寻找文章和论文,适合学术研究。
    • YouTube搜索模式:根据搜索查询找到YouTube视频。
    • Wolfram Alpha搜索模式:使用Wolfram Alpha回答需要计算或数据分析的查询。
    • Reddit搜索模式:搜索Reddit上的讨论和与查询相关的意见。
  • 当前信息:一些搜索工具可能会提供过时信息,因为它们使用爬虫数据并将其转换为嵌入,存储在索引中。与它们不同,Perplexica使用SearxNG,一个元搜索引擎来获取结果,重新排名并找到最相关来源,确保你总是获得最新信息,而无需日常数据更新的开销。

安装

Docker(推荐)

  1. 确保在您的系统上已安装并运行Docker。
  2. 克隆Perplexica仓库:
    git clone https://github.com/ItzCrazyKns/Perplexica.git
    
  3. 克隆后,导航到包含项目文件的目录。
  4. sample.config.toml文件重命名为config.toml。对于Docker设置,您只需填写以下字段:

    • OPENAI:您的OpenAI API密钥。如果您希望使用OpenAI的模型,则只需填写此字段
    • OLLAMA:您的Ollama API URL。您应将其输入为http://host.docker.internal:PORT_NUMBER。如果您在端口11434上安装了Ollama,请使用http://host.docker.internal:11434。对于其他端口,请相应调整。如果您希望使用Ollama的模型而不是OpenAI的模型,则需要填写此字段
    • GROQ:您的Groq API密钥。如果您希望使用Groq的托管模型,则只需填写此字段

      注意:启动Perplexica后,您可以从设置对话框中更改这些字段。

    • SIMILARITY_MEASURE:要使用的相似性测量(默认已填写;如果不确定,可以保留原样)。
  5. 确保您位于包含docker-compose.yaml文件的目录中,并执行:
    docker compose up -d
    
  6. 等待几分钟以完成设置。您可以在浏览器中访问http://localhost:3000来访问Perplexica。

注意:在容器构建完成后,您可以直接从Docker启动Perplexica,而无需打开终端。

非 Docker

  1. 安装SearXNG并在SearXNG设置中允许JSON格式。
  2. 克隆仓库并将根目录下的sample.config.toml文件重命名为config.toml。确保你完成了这个文件中所有必需的字段。
  3. ui文件夹中的.env.example文件重命名为.env,并填写所有必要的字段。
  4. 在填写了配置和环境文件后,在ui文件夹和根目录中运行npm i
  5. 安装依赖项,然后在ui文件夹和根目录中执行npm run build
  6. 最后,通过在ui文件夹和根目录中运行npm run start来启动前端和后端。

注意:推荐使用Docker,因为它简化了设置过程,尤其是对于管理环境变量和依赖项。


相关文章
|
12天前
|
机器学习/深度学习 人工智能 UED
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是一款开源的AI虚拟试衣工具,能够智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。该工具支持半身和全身试穿模式,操作简单,适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。
98 27
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
|
1天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
30 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
5天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
39 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
10天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
93 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
3天前
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
22 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
11天前
|
人工智能 安全 PyTorch
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
SPDL是Meta AI推出的开源高性能AI模型数据加载解决方案,基于多线程技术和异步事件循环,提供高吞吐量、低资源占用的数据加载功能,支持分布式系统和主流AI框架PyTorch。
44 10
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
|
11天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
62 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
|
10天前
|
数据采集 人工智能 编解码
书生·万象InternVL 2.5:上海 AI Lab 开源的多模态大语言模型,超越了目前许多商业模型
书生·万象InternVL 2.5是由上海AI实验室OpenGVLab团队推出的开源多模态大语言模型系列。该模型在多模态理解基准(MMMU)上表现优异,超越了许多商业模型,适用于图像和视频分析、视觉问答、文档理解和多语言处理等多个领域。
56 7
书生·万象InternVL 2.5:上海 AI Lab 开源的多模态大语言模型,超越了目前许多商业模型
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
53 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE
MetaGPT团队开源了Tree-Search Enhanced LLM Agents(SELA)系统,通过蒙特卡罗树搜索(MCTS)优化AutoML过程,显著提升了机器学习模型的构建效率和性能。SELA在20个数据集上的实验结果表明,其性能优于传统AutoML方法和基于LLM的代理,为AutoML领域带来了新的突破。
20 4
下一篇
DataWorks