1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

押さえておきたいLLM用語の基礎解説 第1回 AI・大規模言語モデル・生成AI・ニューラルネットワーク・ディープラーニング

マイナビニュース / 2024年9月10日 7時0分

画像提供:マイナビニュース

AI技術の急速な発展により、日常生活やビジネスに大きな変化を体験した人も多いだろう。近年では生成AIや、その中心となるLLM(Large Language Models:大規模言語モデル)の発展が目覚ましい。TECH+でも、多くの活用事例や最新技術を紹介している。だがしかし、その仕組みや専門用語を理解するのは、意外と難しい。

そこで本連載では、生成AIやLLMに関連する用語について解説する。日々のビジネスや資格取得に向けた勉強、弊誌をはじめニュース記事を読む際の補足として活用してほしい。用語解説を担当するのは、ソフトバンク子会社で日本語に特化したLLMの開発を進めるSB Intuitionsのエンジニアリングチーム。
AI

Artificial Intelligence(人工知能)の略。明確な定義はないが、例えば、言葉を聞いて理解して話す、画像の状況を説明するなど、数式化が困難で人間にしかできないと考えられてきた特徴的な知的能力を、大規模なデータを用いた深層学習などによって近似した関数、またはその関数を含む計算処理やシステム全体を指す言葉として使われる場面が多い。

ただし、必ずしも人間の能力を模しているわけではなく、何か特定の目標を達成する能力の計算部分のことや、自律的に判断し行動することができる機械の制御部、またはそれらを含む計算処理やシステム全体などを表す言葉としても広く用いられる。(泉 健太)
○参考

[1] Roberts, Daniel A., Sho Yaida, and Boris Hanin. The principles of deep learning theory. Vol. 46. Cambridge, MA, USA: Cambridge University Press, 2022.
[2] Project JMC Team. John McCarthy's Website. 11 Feb. 2012, http://jmc.stanford.edu/index.html. Accessed 27 Aug. 2024.
大規模言語モデル(LLM)

言語モデルとは、テキスト中の要素の出現確率の分布を予測する仕組みであり、テキストの生成などに応用できる。その中で、大規模言語モデルは巨大なニューラルネットワークが、膨大なテキストデータで訓練されている言語モデルである。最先端の大規模言語モデルは数千億の構成要素を持ち、多くのタスクを人間に匹敵する精度でこなせる。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください