Yahoo!ニュース

ChatGPTでも不合格? 会話型AIの「本当の実力」を測る新ベンチマークが登場

配信

AMP[アンプ]

会話型AIエージェントの精度を測る「t-bench」

AIエージェント評価における課題

1/3ページ

【関連記事】