URLをコピーしました

入社半年のIT未経験者が挑む！生成AIプロジェクトに飛び込んでみた

2024.10.21 （初回公開日：2024.10.21）

URLをコピーしました

生成AI研究チーム

はじめに

こんにちは、今年4月に入社したばかりのカマGと申します。

私は文系の大学を卒業したため、ITに関しては未経験であり、ほとんど知識がありませんでした。入社後は、6月末までJavaとSpringフレームワークを中心とした研修を受けました。そして、7月初旬に配属先が決まり、配属初日に生成AIプロジェクトに参加することを知りました。

配属当初は、生成AIについての知識がほとんどなく、最新の技術に触れることへの期待感があった反面、新参者の自分に務まるのかという不安な気持ちもありました。配属するまでは、生成AIについてのニュースをたまに耳にしたり、ChatGPTを要約などで利用したりする程度でした。

そのため、生成AIの処理の流れや、それがどのような技術で成り立っているかなどの知識は全くありませんでした。そんな自分が、生成AIプロジェクトに飛び込んでみての取り組みをご紹介します。

社内での生成AIプロジェクトの概要

現在、私が参加しているプロジェクトは、社内の生成AI研究の一環として取り組んでいるものです。

具体的には、LLM(Large Language Model)を利用してユーザーが入力した質問に答える社内チャットボットの開発を行っています。このチャットボットでは、RAG（Retrieval-Augmented Generation）を利用しているため、一般的な質問だけでなく、社内情報に関する問い合わせにも対応しています。

LLM(Large Language Model)とは

Large Language Model（LLM）は、現代の自然言語処理技術において非常に重要な役割を果たしています。

これらのモデルは、大量のテキストデータと深層学習技術を組み合わせることで構築され、人間のような自然な文章を生成する能力を持っています。AIが「バナナの色は」に対して、「黄色です」「緑です」「茶色です」などの続くパターンの確率を学習し、予測した上で文章を生成しています。

代表的なLLMには、Meta社のLLaMa3.2やGoogle社のPaLM2、そしてAnthropic社のClaude3などがあります。私のプロジェクトでは、ChatGPTで使用されているものと同じモデルであるOpenAI社のGPT-4oを利用しており、その卓越した性能に日々新しい発見をしています。これらのLLMの背後には、人工ニューラルネットワークという技術が用いられています。

人工ニューラルネットワークは、人間の脳の機能を模したコンピュータシステムで、テキストデータの文脈やニュアンスを理解し処理することを可能にしました。これは、私たちが家族や友人、職場の先輩と何度も会うことで顔と名前が一致する脳の仕組みに近いと思いました。この技術の１種であるTransformerをベースとしたChatGPTの誕生により、LLMは急速に普及しました。

最近では、このような人工ニューラルネットワークを用いた機械学習の成果が、ノーベル物理学賞を受賞するほどの注目を集めています。私は、最初に「LLM（大規模言語モデル）」という言葉を聞いたときは、正直、難しそうだなと感じました。

しかし、普段何気なく使っていたChatGPTの裏側にこんな仕組みがあることを知り、とても驚きました。特に、脳の機能を模しているという点が印象的で、一見関係のなさそうな生物学的な要素から新たな発想を広げているのがすごいと思いました。

また、膨大な言葉のパターンを学習して自然な文章を生成する仕組みは、私たちが言葉を覚え、会話ができるようになる過程に似ている部分があると感じました。

RAG（Retrieval-Augmented GenerationまたはRetrieval-Augmented Generative)とは

RAGとは、生成AIが情報を生成する際に、データベースなどから情報源を検索して、生成に情報を補完する技術のことです。

私は、RAGについて、持ち込み可のテストで、書籍やノートを持ちこんで解答するようなイメージで理解できました。RAGを利用することで、生成AIが学習した既存のデータに加え、外部の情報源を参照することで、より正確で信頼性の高い情報を提供することが可能になります。

しかし、書籍やノートから特定の答えを探すのに時間がかかるように、RAGを利用すると生成AIの回答に時間がかかってしまうことがデメリットです。RAGとともに話題に出るもので、ファインチューニングというものがあります。

ファインチューニングとは、既存の大規模言語モデル（LLM）に追加の情報を学習させ、特定のニーズに応じた回答を可能にする手法です。

先程の例を用いると、RAGが持ち込み可のテストであるのに対して、ファインチューニングは自分で勉強して覚えた後にテストを受けるようなものです。これにより、独特な表現や概念にも対応しつつ、既存のLLMの能力を生かすことができます。

しかし、テスト勉強に時間や労力がかかることと同様に、ファインチューニングでは、追加学習用のデータ作成にコストがかかることや、LLMのモデルが変わるごとに追加学習を行う必要があるなどのデメリットもあります。それに比べると、RAGは情報を探すだけで、学習データの準備やモデルごとの学習は不要であるため、コストを抑えられます。

私のプロジェクトでは、社内情報を守りつつ、情報の正確性が必要なことに加え、運用コストを抑えるためにRAGを利用する形になりました。RAGについて知るまでは、外部情報を用いて必要な情報をChatGPTの生成に活用できるとは思いもよりませんでした。以前の私と同じように、RAGについて知らない人はまだ多いのではないかと思います。

個人的には、今後RAGが広まり、個人で生成内容のカスタマイズが可能なChatGPTのようなサービスが広がっていくと、面白くなると感じました。

おわりに

今回は、生成AIプロジェクトの概要とLLM、RAGについて新人なりに紹介しました。生成AIプロジェクトへの参加を通じて、今後も学びを深めながら成長を続けていきます。

次回は、プロジェクトでの開発の取り組みについてより具体的にお話しします。この記事が少しでも参考になれば幸いです。

お問い合わせ

タイトル必須
お名前必須
お名前（フリガナ）必須
メールアドレス必須
会社名必須
部署
役職
電話番号必須
お問い合わせ内容

個人情報保護方針

株式会社システムズは、コンピュータ関連システムの構築、コンサルテーション、ソフトウェアの開発・設計・販売・保守等を提供するに当たり、個人情報はお客様、お取引先様、株主様および従業者等からお預かりした重要な資産であるという認識のもと、情報社会の一端を担う企業としての社会的責務を全うするため、個人情報に関する法令、国が定める指針、規範に基づき以下に個人情報保護方針を定め、個人情報の厳正な取り扱いに努めます。

1.目的

個人情報の重要性を全社員・役員に認識させ、個人情報に関する法令、国が定める指針、規範を遵守するとともに、管理規程を制定し着実に実施いたします。またこれらの取り組みを継続的に維持および改善いたします。

2.個人情報の取得

個人情報はお客様ご本人に利用目的を明示し同意を得た上で、サービス提供上必要な範囲内で取得します。

3.個人情報の利用

取得した個人情報は利用目的にのみ使用します。お客様の同意がある場合または法令・指針・規範等に基づく場合を除き、目的外利用および第三者への提供・開示はいたしません。またそのための措置を講じます。

4.Googleアナリティクスの利用

当サイトは、利用状況を把握し、サイトの改善を図るため、Googleアナリティクスを利用しています。Google社が訪問履歴を収集・記録・分析しますが、個人を識別する情報は含まれておりません。
当サイトではGoogleアナリティクスデータとお問い合わせフォームから送信された個人情報を紐付けることが可能ですが、これを第三者に無断で提供・販売することはありません。
Googleアナリティクスの利用規約とプライバシーポリシーにつきましては、Google社のサイトでご確認ください。
Google Analyticsの利用規約
 Googleのプライバシーポリシー

また、Googleアナリティクスによる情報収集を停止することも可能です。「Google アナリティクスオプトアウトアドオン」をインストールし、ブラウザのアドオン設定を変更してください。

5.クッキーについて

当サイトでは、ウェブサイトの利便性向上を目的にクッキーを利用しています。クッキーはサーバーから利用者に送信されブラウザに保存される情報です。クッキーは無効にすることもできますが、その結果サイト機能の一部またはすべてが利用できなくなる可能性があります。

6.個人情報の管理

取得した個人情報について、充分な安全対策を実施し管理することで、不正アクセス・漏えい・滅失・毀損等の防止・是正をいたします。

7.苦情・お問い合わせへの対応

個人情報への扱いに対するお客様からの苦情およびお問い合わせには、誠意ある対応をいたします。

8.個人情報の開示等

取得した個人情報に関して、お客様ご本人からの訂正・削除および開示等のご要望には迅速かつ適切な対応をいたします。

制定日 2005年4月1日
改定日 2011年10月1日
株式会社システムズ
代表取締役社長小河原隆史

当社の個人情報の取扱いにつきまして、ご意見・ご質問等ございましたら、下記までご連絡くださいますようお願い申し上げます。

株式会社システムズ　個人情報保護に関するお問い合わせ先
個人情報お問い合わせ窓口
株式会社システムズ　個人情報窓口