Found 6 items with this tag.
Weave 是一个轻量级工具包,旨在追踪和评估 LLM 应用程序,提升 AI 应用的开发效率。
Galileo 是一个专为构建 AI 应用程序而设的平台,专注于减少幻觉和提升模型性能的创新技术。
Kolena是一个AI评估平台,通过自动化大型语言模型的评估,借助人类偏好建模来提升产品质量。
Encord是一个领先的数据开发平台,通过强大的标注和评估工具简化数据管理并提升AI模型性能。
Patronus AI 是一个创新的自动评估平台,帮助企业识别大型语言模型的错误,并自信地使用生成式人工智能。
Flow AI 提供先进的工具,用于评估和合并语言模型,提升 AI 应用的开发和精确度。