evaluation

找到 6 个带有此标签的项目

AI Productivity Automation Content Marketing Video Design Collaboration Creativity SEO Education Writing Tools NoCode Finance

Weave

Weave

Weave 是一个轻量级工具包，旨在追踪和评估 LLM 应用程序，提升 AI 应用的开发效率。

AI tracking evaluation

Galileo

Galileo

Galileo 是一个专为构建 AI 应用程序而设的平台，专注于减少幻觉和提升模型性能的创新技术。

AI Monitoring Platform

Kolena

Kolena

Kolena是一个AI评估平台，通过自动化大型语言模型的评估，借助人类偏好建模来提升产品质量。

AI Automation evaluation

Encord

Encord

Encord是一个领先的数据开发平台，通过强大的标注和评估工具简化数据管理并提升AI模型性能。

AI Data evaluation

Patronus AI

Patronus AI

Patronus AI 是一个创新的自动评估平台，帮助企业识别大型语言模型的错误，并自信地使用生成式人工智能。

AI Automation Generative

Flow AI

Flow AI

Flow AI 提供先进的工具，用于评估和合并语言模型，提升 AI 应用的开发和精确度。

AI Productivity evaluation