Yahoo!ニュース

ChatGPTでも不合格? 会話型AIの「本当の実力」を測る新ベンチマークが登場

配信

AMP[アンプ]

t-benchの仕組みと特徴

GPT-4oでも評価は50%未満

2/3ページ

【関連記事】