Found 6 items with this tag.
Weave 是一個輕量化工具包,旨在追蹤和評估 LLM 應用程式,提升 AI 應用的開發效率。
Galileo 是一個專為建構 AI 應用程序而設的平台,專注於減少幻覺和提升模型性能的創新技術。
Kolena是一個AI評估平台,透過自動化大型語言模型的評估,藉由人類偏好建模來提升產品品質。
Encord是一個領先的數據開發平台,透過強大的標註和評估工具簡化數據管理並提升AI模型性能。
Patronus AI 是一個創新的自動評估平台,幫助企業識別大型語言模型的錯誤,並自信地使用生成式人工智慧。
Flow AI 提供先進的工具,用於評估和合併語言模型,提升 AI 應用的開發和精確度。