LLMとは
ChatGPTや、Geminiなどの、LLM(大規模言語モデル)を仕事に活かす時代がやってきました。
最新のLLM
人世代前までは、対話システムは、話をし続けていると、おかしな対話が返ってくることが多かったのですが、最新のLLMは、対話の破綻はなくなりました。
また、ハルシネーションといって、嘘の返答をもっともらしく答えることが多かったのですが、最新のLLMでは、だいぶ改善されてきました。
- 程度聞きたいことを、きちんと返答できる。
- 文脈を考慮して、対話を続ける。
- 画像やPDFなども取り扱える。
ChatGPT-4oや、Gemini Pro など、高性能なAIが登場して、仕事に使えるAI時代がやってまいりました。
生成AIという名前が、マスコミにも登場するようになり、すでにAI時代が到来しております。
LLM開発の問題点
技術が日新月歩、すぐに新しい技術が現れて、対応が追いつかない。
LLMの学習には、膨大な計算リソースが必要で、そのための環境が整っていない。
たまに、ハルシネーションを起こすことがあり、これを100パーセント取り除くことができないため、致命的な問題になることがある
弊社の提案
LLMでは、RAGという手法や、 ファインチューニングによってカスタマイズをしたり、 オープンソースモデルが登場して、システムに組み込みやすいようになってきました。
まずは、弊社は、最新のLLMを検証して、新たなソリューションを開発し続けます。
LLMがお客様の仕事のどの部分に使えるか、ご提案をして参ります。
LLMについて
LLMに関するQ&Aをまとめました。
知りたい質問があったら、質問を、クリックしてください。
自然言語処理とは?
人間の音声や、入力したテキストをもとに、人間のような会話で、応答するためのシステムです。
音声認識と自然言語処理は違うの?
音声認識は、音声を認識して、人間の言葉(テキスト)にするところまでをいいます。
自然言語処理は音声認識を含みますが、その内容の解析および、その意味している内容に対する応答を含みます。
どうやって人間の言葉を認識するの?
大量の文章を集めて、それをコンピューターで解析して、単語や文法、文脈などの情報を学習します。
その結果より、システムの発話を作成して応答を返します。
細かい処理は、各社の技術によってだいぶ違いますし、得意、不得意などもあり、各社研究を進めています。
AIやディープラーニングと自然言語処理の関係は?
今日、ハードウエアの進化とディープラーニング技術の発達によって、画像などの認識は人間の性能に近づいております。
ディープラーニングを利用して、自然言語処理を行う研究もだいぶ進んできています。
しかし、単に機械処理だけではうまくいかないことがあります。
LLMを動かすための環境はどういうものが必要?
簡単なものであれば、普通のPCで動作します。しかし、chatGPT等の大規模のものは、GPUを搭載するような、高性能なPCやクラウド環境が必要になります。
現在では、さまざまなLLMをサービスするウェブがたくさんあります。そのようなものを利用するのも一つのソリューションです。
RAGとは何ですか?
RAGとは、Retrieval-Augmented Generationの略で、LLMにおいて、学習してない内容について、答えるための手法です。
従来は、企業特有の内容を答えるためには、LLMの再学習が必要でした。
しかし、LLMの規模が大きくなってきたため、費用が膨大にかかることが問題でした。
RAGでは、対話の最初に既存の情報を読み込ませて、その内容について返答させることによって、学習していない内容も返答させることができます。
ただし、一度に質問する文字数の制限があるため、あまり多くのデータを読み込ませることができません。
RAGについては、日新月歩で進化しておりますので、お問い合わせください。
マルチモーダルって何ですか?
マルチモーダルとは、言語以外の複数の情報(画像、音声、映像)を組み合わせて、処理することです。
人間は、言語以外の情報を取得して、総合的に判断し、返答をしています。
LLMも同様に、色々な情報を組み合わせることができるようになってきました。
例えば、画像とテキストを組み合わせて、その内容を理解することができます。
ファインチューニングって何ですか?
ファインチューニングとは、既存のLLMに対して、ローカルな話題など特別な返答をして欲しい時、既存の学習データに個別の返答を追加して、カスタマイズされた返答をさせることができる技術です。
RAGとファインチューニングは、メリットとデメリットがあります。
カスタマイズの内容によっては、RAGとファインチューニングを組み合わせたりします。