Simular.ai
扫码查看

可以像人一样操作电脑的AI智能体,用于自动化计算机任务和优化工作流程。

Simular.ai

综合介绍

Simular.ai 是一家致力于开发能够像人类一样操作计算机的自主AI智能体公司。 这家公司由前DeepMind的科学家和工程师创立,他们将多智能体系统、强化学习等领域的尖端经验应用于打造真正实用的智能体。 Simular.ai的核心产品是一款运行在用户设备上的AI智能体,目前主要支持macOS。 它通过模拟人类的点击、打字等行为来操作各种软件和网站,从而帮助用户自动完成重复性的电脑工作。 这种在本地设备上运行的模式保证了用户的隐私和数据安全。 Simular.ai的技术采用了神经符号方法,结合了大型语言模型的灵活性和符号代码的精确性,旨在实现终身强化学习。 Simular.ai不仅面向个人用户,也为企业提供自动化解决方案,特别是在保险和医疗等需要处理大量表单的行业。

功能列表

  • 自主执行复杂的数字任务: 可以在浏览器内自主完成复杂的在线任务。
  • 工作流录制与回放: 能够将用户在桌面上的操作流程录制成清晰、可编辑的文本指令,并根据这些指令按需回放。
  • 跨网页信息获取: 支持跨多个网站获取并整合信息。
  • 本地化运行,保障隐私安全: 智能体在本地的沙盒浏览器中运行,确保用户的登录信息和会话数据安全地保留在自己的Mac上。
  • 人机协同控制: 用户可以与智能体同时操作浏览器,无需正式的交接,可以随时介入点击、输入和编辑。
  • 自然语言交互: 用户可以使用简单的自然语言与Mac进行交互,轻松管理文件、打开文档或运行复杂的快捷指令。
  • 自动化重复性任务: 用户可以利用编程脚本或内置的自动化功能来简化日常工作流程,节省时间并减少错误。

使用帮助

Simular.ai 是一款旨在通过自动化计算机操作来解放用户时间的AI智能体。 它目前主要以macOS应用的形式提供,让你的Mac电脑拥有一个可以与你协同工作的“伙伴”。

安装与设置

Simular.ai 的安装过程非常简单,特别是对于其开源的 Agent S2 框架。以下是基本的安装步骤:

  1. 克隆代码库:首先,你需要从GitHub上克隆Agent S2的代码库。打开你的终端并输入以下命令:
    git clone https://github.com/simular-ai/Agent-S.git
    
  2. 安装依赖:接着,安装所需要的软件包:
    pip install gui-agents
    
  3. 设置API密钥:你需要设置你的大语言模型(LLM)API密钥。这可以通过将以下命令添加到你的 .bashrc (Linux) 或 .zshrc (macOS) 文件中来完成:
    export OPENAI_API_KEY="YOUR_API_KEY"
    

    Simular.ai 同时支持Azure OpenAI、Anthropic和vLLM等多种模型。

  4. 设置OCR服务器:为了让智能体能够“看到”屏幕内容,需要设置OCR(光学字符识别)服务器。在一个新的终端中,设置OCR服务器地址:
    export OCR_SERVER_ADDRESS="http://127.0.0.1:8080/ocr"
    

    然后运行OCR服务器文件。

  5. 设置网页信息检索 (可选):为了获得更好的体验,你可以设置Perplexica来进行网页信息检索。这需要Docker Desktop的支持。

注意: 在Linux机器上,创建conda虚拟环境可能会与pyatspi发生冲突。建议在不使用conda或其他虚拟环境的情况下进行安装。

核心功能操作

安装完成后,你就可以开始体验Simular.ai的强大功能了。

通过自然语言下达指令

Simular.ai 最直观的使用方式就是通过自然语言向它下达指令。你可以像和朋友聊天一样,告诉它你需要做什么。例如,你可以说:

  • “帮我计划一个从新加坡到巴黎的7天旅行,预算5000美元。”
  • “查找一下购买特斯拉Model 3的最优惠价格。”
  • “搜索今天排名前五的股票市场网站,并总结一下市场趋势。”

Simular.ai会理解你的意图,并自动打开浏览器,浏览相关网页,收集信息,最后将结果呈现给你。

工作流录制与回放

这是Simular.ai一个非常实用的功能。你可以将一系列重复性的操作录制下来,之后一键回放。

  1. 录制: 启动录制功能后,你在电脑上的每一步操作,例如打开特定软件、填写表单、复制粘贴数据等,都会被记录下来,并转换成自然语言的文本指令。
  2. 编辑: 你可以像编辑文本文档一样,对录制下来的指令进行修改和优化。
  3. 回放: 当你需要再次执行这一系列操作时,只需运行相应的文本指令,Simular.ai就会自动完成所有步骤。

这个功能对于处理日常报表、数据录入等重复性工作非常有效。

与智能体协同工作

Simular.ai强调的是与用户“协同工作”,而不是完全取代用户。 在智能体执行任务的过程中,你可以随时介入:

  • 点击链接: 当智能体在浏览网页时,你可以随时点击你感兴趣的链接。
  • 编辑表单: 如果智能体填写的表单信息有误,你可以直接修改。
  • 中途打断: 你可以随时暂停智能体的任务,并给出新的指令。

这种共享控制的模式让你始终对整个过程拥有控制权,同时也享受到了自动化带来的便利。

Simular Cloud

对于不想在本地进行复杂设置的用户,Simular.ai 还提供了云端版本 Simular Cloud。 你可以直接在云端使用一个预先配置好的、拥有强大AI智能体的虚拟计算机。 Simular Cloud 提供免费和付费两种方案,免费用户需要排队使用共享计算机。

应用场景

  1. 日常数字杂务需要跨不同网站检查多个订单的状态吗?Simular可以处理重复性的浏览工作,让你专注于其他事情。
  2. 网上购物计划一个活动,生成一个清单,然后将商品添加到购物车。Simular可以从头到尾完成这个过程,但在购买前总会与你确认。
  3. 研究任务Simular可以像人类一样浏览浏览器标签页,查找文章、总结页面或滚动浏览网页表单。
  4. 保险和医疗行业这两个行业有大量的重复性计算机工作,例如填写表格。Simular Pro版本的目标用户就是这些行业,帮助他们实现自动化。
  5. 金融领域在金融领域,摩根大通使用Simular智能体将商业贷款处理的89%自动化。这些智能体在23个不同的监管数据库中检查申请人数据,并根据实时市场数据生成风险评估报告。

QA

  1. Simular.ai是什么?Simular.ai 是一家开发自主AI智能体的公司,其产品可以像人类一样操作电脑,自动完成各种任务。
  2. Simular.ai 如何保障我的数据安全?Simular.ai 的智能体在你的Mac本地一个沙盒化的浏览器中运行,这意味着你的登录凭据和会话数据都保留在你自己的设备上,不会上传到云端。
  3. 我需要会编程才能使用Simular.ai吗?对于基本的使用,你不需要编程知识,可以通过自然语言下达指令。 不过,Simular Pro版本目前更适合习惯轻度编码的用户,以达到最佳性能。
  4. Simular.ai 支持哪些操作系统?目前主要支持macOS,特别是搭载Silicon芯片和macOS 15以上的版本。 同时,其开源框架也支持Windows和Linux。
  5. Simular.ai 是免费的吗?Simular.ai 提供不同的产品和定价方案。它有开源的框架供开发者使用,也有提供免费和付费订阅的Simular Cloud服务。 Simular Pro是针对专业用户的高级付费版本。
微信微博Email复制链接