您当前位置：首页 - 科技资讯 - Anthropic升级Claude 3.5 Sonnet系列工具：深度优化提示策略，强化评估与测试功能

Anthropic升级Claude 3.5 Sonnet系列工具：深度优化提示策略，强化评估与测试功能

文章来源：互联网作者：肉团资源网发布时间：2024-10-16 14:47:49

近日消息，Anthropic公司正式对外公布了其在人工智能领域的一系列创新举措。依托于Claude 3.5 Sonnet这一先进的大语言模型，该公司已成功研发出一系列新工具，旨在自动化并精细化提示词（prompt）的生成过程，进而显著提升AI系统的交互质量和效率。

Anthropic 控制面板新增“评估”（Evaluate）单元，借助 Claude 3.5 Sonnet 大语言模型，帮助开发者高效地生成、微调和测试提示（Prompt）。

这些增强功能旨在改进语言模型对各种任务的响应，为使用 Claude 开发人工智能产品的企业提供宝贵的资源。

开发者只需描述任务（例如“分流处理客户支持请求”），Claude 就会为你生成一个高质量的提示。

有效测试和评估

开发者在“评估”选项卡中，可以根据各种场景测试其人工智能应用程序的提示。

用户可以上传真实示例或者使用 Claude 生成案例，从而对比不同提示之间的有效性，答案以五分制进行评估，便于开发者直观评估。

在 1 个博客示例中，开发者只需调整一行，就能在所有测试中生成更长、更详细的答案，从而节省时间和提高生产率。

测试机制

新工具支持手动和自动测试提示。开发人员可以生成输入变量，查看 Claude 的响应情况，并在需要时手动输入测试用例。

根据多个真实输入进行测试有助于在生产部署前验证提示质量。开发人员可以手动添加或从 CSV 中导入新的测试用例，或请求 Claude 创建测试用例。

Anthropic携《Claude》安卓应用入场，蓄力竞逐AI聊天机器人市场版图

近日消息，Anthropic公司宣布了Claude Android应用的发布，继五月成功上线iOS版本之后，此举标志着其在扩展AI聊天机器人市场份额上的又一重要步骤。

Anthropic携《Claude》安卓应用入场，蓄力竞逐AI聊天机器人市场版图

这款应用程序致力于为Android用户带来更流畅的Claude互动体验，同时显露了其意欲与当前行业领头羊ChatGPT一竞高下的雄心。

Claude Android应用的功能与iOS版本相似，为用户提供免费访问Anthropic最先进的AI模型Claude3.5Sonnet的机会。用户可以通过Anthropic的Pro和Team订阅计划获得更多高级功能。该应用支持跨设备对话同步、实时图像分析和文件上传功能。Anthropic还特别强调了应用内的实时语言翻译功能，希望借此吸引更多用户。

值得注意的是，Claude Android应用还为企业客户提供了移动端访问其Claude账户的便利。这一功能有望提升Claude在商业环境中的应用价值。

尽管Anthropic声称其AI模型在技术水平上不亚于OpenAI和谷歌的产品，但该公司在吸引消费者方面仍面临挑战。数据显示，Claude iOS应用在推出两个月后的表现相对平淡，首周全球下载量为15.7万次，远低于ChatGPT iOS应用首五天48万次的安装量。

随着Android版本的推出，Anthropic希望能够扩大其用户基础，提高市场竞争力。然而，在已有强劲对手占据优势的AI聊天机器人市场中，Claude能否突出重围仍有待观察。