Yahoo!ニュース

NVIDIA、LLMの精度を維持しつつサイズを半分にするアプローチ 巨大モデルの運用コスト低下への期待

配信

AMP[アンプ]

クオンタイズではないアプローチ、プルーニングとディスティレーション

2/3ページ

【関連記事】