Yahoo!ニュース

NVIDIA、LLMの精度を維持しつつサイズを半分にするアプローチ 巨大モデルの運用コスト低下への期待

配信

AMP[アンプ]

プルーニングとディスティレーション、その効果とは?

文:細谷元(Livit)

3/3ページ

【関連記事】