Manus 的爆火预示着 AI 正在从单纯的文本生成和图像识别迈向更复杂的交互场景。字节跳动近期推出的开源项目 UI-TARS Desktop 为我们展示了一种全新的可能性:能够通过自然语言理解和处理来控制计算机界面。这款工具代表了人工智能与人机交互领域的重大突破,为用户提供了一种全新的、更加自然的方式来操作计算机系统。 在项目落地实践中,高效稳定的底层模型支撑很关键,PPIO 派欧云作为一站式 AIGC 云服务平台,提供高性能的 API 服务,涵盖了最新的 DeepSeek、QwQ 等系列模型,低价、稳定、快速,仅需一行代码即可调用。Documentation Index
Fetch the complete documentation index at: https://ppio.com/docs/llms.txt
Use this file to discover all available pages before exploring further.
PPIO x UI-Tars 图文使用教程
- 配置前置条件
https://api.ppio.com/openai
(2) 获取【API Key】:登录派欧云控制台API密钥管理页面,点击创建按钮。注册账号填写邀请码【VOJL20】得代金券
- deepseek/deepseek-v3-0324
- deepseek/deepseek-r1-turbo
- deepseek/deepseek-v3-turbo
- qwen/qwq-32b
- 安装和配置 UI-Tars

运行效果展示
输入我们准备好的prompt: