top of page
全般


生成AIを活用したアバターの可能性: HeyGenで未来のインタラクティブ体験を試す
最近では、生成AIを活用したさまざまなサービスが続々と登場し、これらを組み合わせることで、今は想像もつかないような革新的なアイデアが生まれる可能性を感じています。今回はその中でも、HeyGenというサービスを試してみたので、ご紹介します。 HeyGenは、撮影した動画や音声データをもとに、AIがアバターを通じて発話したり、インタラクティブな対話が可能になるプラットフォームです。私は特に、将来的にコールセンター業務などをアバターを使ったチャット形式に置き換えることで、コスト削減が実現できるのではないかと期待しています。 今回は、自分の動画と音声を基にHeyGenを使い、私が実際に発したことのない言葉をアバターに話させることに挑戦してみました。 詳しくはQiitaの記事をご覧ください https://qiita.com/ogi_kimura/items/4e653af5e94b89188b56
たろう 木村
2024年12月8日読了時間: 1分


PowerShellを駆使してQiita閲覧数を効率化!作業時間30万円分を節約する自動ツール
最近、記事を頻繁に投稿するようになったのですが、悪い癖で「今日はどれくらいの方が読んでくれたのだろう…」と、ついつい確認したくなってしまいます。その度にQiita APIを送信するため手作業でいろいろと設定し、閲覧数を確認していました。 ...
たろう 木村
2024年12月8日読了時間: 1分


ローカルLLMの進化:Llama3.2で特許検索システムを再構築!
今回は、「ローカルLLM」にリベンジします。以前、ローカル環境にLLMを構築した際、その過程を記事にまとめました。しかし、結果として応答に10分以上かかることが多く、実用には程遠い状況でした。(記事公開後も再度トライしてみましたが、1時間以上応答がないことも珍しくありませんでした…) 諦めかけていたところ、@coitateさんの投稿を見て、もう一度挑戦してみることにしました。Meta社からLlama3.2が発表され、さらに軽量化されたという記事を読んだからです。@coitateさん、素晴らしい投稿ありがとうございます! 詳しくはQiitaの記事をご覧ください https://qiita.com/ogi_kimura/items/7e2e00049ba14aca716a
たろう 木村
2024年12月8日読了時間: 1分


LangChainとNeo4jでシステム連携図を自動生成する方法
社内でシステムの管理をしていると、各システムの連携を図や表で表す必要が出てくることがよくあります。しかし、人間は細かい管理には向いておらず、定期的なメンテナンスや最新化、そして統一された粒度(レベル)の管理を続けるのは非常に困難です。 そんな中で、最近「Neo4j」というグラフ描画ツールの存在を知りました。「LangChain」と「Neo4j」を使って効率的にグラフを作成する記事を目にし、これが私が求めていた「システム連携図の自動生成ツール」になるのではないかと考えました。そこで今回は、「LangChain」と「Neo4j」を実際に試してみました。 詳しくはQiitaの記事をご覧ください https://qiita.com/ogi_kimura/items/1e03b29bb245b553be26
たろう 木村
2024年12月8日読了時間: 1分


電子化対応を支援する!請求書自動整理ツールのご紹介
# 最近思うこと 2024年1月に電子帳簿保存法が改定され、領収書や請求書を紙ではなく電子データのまま保存できるようになりました。さらに、同年10月には郵便料金の値上げも予定されています。この変化により、多くの企業では経営層や他部署から「なぜ電子化に対応していないのか?」という声が上がり、情報システム部門が大規模なシステム導入を迫られることが予想されます。こうしたシステムには数百万円から数千万円の投資が必要で、導入の際には費用対効果が重要なポイントとなります。 ただ、電子化によって削減される作業時間を正確に定量化するのは難しく、その効果を見える形にすることは簡単ではありません。削減された業務時間を、よりクリエイティブで価値の高いタスクに活用することが理想ですが、日本全体として、就職後にスキルアップに取り組む意識が低い傾向があり、システム導入により余剰となった時間を効果的に使いこなせないケースが多いのが現実です。これでは、せっかく業務効率化を進めても、その効果が十分に活かされません。これは、「パーキンソンの法則」が示すように、与えられた時間に合
たろう 木村
2024年12月8日読了時間: 3分


OCR vs OpenAIで表を解析してみた!精度の比較と課題を徹底検証
先日、「OCRとOpenAIの比較」や「宝くじの番号をOCRで一括確認する方法」に関する記事を投稿しました。主に画像内の文字や数字の認識精度を比較した内容です。詳しくは以下の記事をご覧ください。 今回は、表形式の画像に焦点を当てて、OCRとOpenAIの認識精度を比較してみようと思います。 私自身は現在、別の業務の傍ら「特許情報検索システム」の開発を進めています。特許情報には文章だけでなく、図や数式、表なども含まれるため、それらの内容を正確に読み取る技術が必要です。特に、表の認識精度向上は非常に重要な課題です。この調査結果は今後のシステム開発の貴重な知見となると考えています。 詳しくはQiitaの記事をご覧ください https://qiita.com/ogi_kimura/items/c6d85efae7641bde7041
たろう 木村
2024年12月8日読了時間: 1分


ローカルLLMをWindowsで動かしてみた話
最近「ローカルLLM」という言葉に惹かれ、調べてみたところ、なんとChatGPTのような言語モデルをローカルPC上で構築できるということを知りました。@ksonodaさんの投稿記事を参考にさせて頂きました。ありがとうございます。 これまで、過去の投稿記事でRAG(Retrieval Augmented Generation)をローカルPC上で動かすことに成功していたので(下記の過去の投稿記事)、もしかしたら生成AIに関するすべての処理を自前で完結させることができるかもしれない、という期待が膨らんできました。 そこで今回は、ローカルでのLLM構築に挑戦してみた体験談を共有したいと思います。 詳しくはQiitaの記事をご覧ください https://qiita.com/ogi_kimura/items/45dffc2bc8334561a432
たろう 木村
2024年12月8日読了時間: 1分


宝くじの番号をOCRで一括確認
今回は、宝くじ券の番号をOCRで認識させるプログラムを紹介します。私事で恐縮なのですが、先日「宝くじ記念くじ」を150枚買ったのですが、券を1つ1つ確認すると歳のせいか手がカサカサになり、紙で指が切れて血が出てしまいました。 OCRを使って当選した券を瞬時に見分けられないか、ということで、宝くじ券番号を一括で大量に読み込んで、当選した宝くじ券を判定するプログラムを作成しました。「そんなこと、券売所の機械で店員さんに確認してもらえばいいのに。」と思う方もいるかと思いますが、そこはご愛敬ということで・・・ 詳しくはQiitaの記事をご覧ください https://qiita.com/drafts/d2dd5466f3e1e125f6e4/edit
たろう 木村
2024年12月8日読了時間: 1分


OCRとOpenAIを比較してみた
情報システム部にいると、「OCRを試してみたい」とか「紙の帳票はやめないが、効率化を図りたい」などといろいろな引き合いが舞い込んできます。そのためOCRを小さなプロジェクトやPoCで試すことも多いのですが、文字認識の精度のせいなのか、ほとんどは立ち消えになってしまっています。 一方で、最近リリースされたgpt-4oは画像認識が可能であり、OCRよりも精度が高いのではないか?と思い始めました。 今回は、OCRとgpt-4o(お金がないので正確にはgpt-4o-mini)の読み取り精度を確認したいと思います。 詳しくはQiitaの記事をご覧ください https://qiita.com/ogi_kimura/items/f6b8e3426349767e8f7b
たろう 木村
2024年12月8日読了時間: 1分


Excelマクロで仕事効率化(初心者向け)
私の勤務先では、ほぼ100%の社員がプログラミングを書くことができません。それ自体はそれほど大きな問題ではないのですが、社員が皆プログラムを書けないことで、「ラストONEマイル」(※)に苦労しており、多くの方々が毎日「Excel」や「Word」と格闘する羽目になっています。社員の多くが、数十回もデータのコピー&ペーストを繰り返したり、Excelに大量のセル計算式を貼付けてファイルが重くなったり、合計値を出すセルの計算式で1セルだけ範囲から漏れていて、後でやり直しになったり(リワーク)という状況を多く見てきました。「DX」や「AI」が叫ばれている昨今ですが、現状はそれからは程遠く、ほとんどが泥臭い単純作業です。 一つ具体的な例を挙げると、社内の月次締め処理を行う時、社員が夜遅くまで事務所に残って、データの目検チェックやデータ貼付けで大変苦しそうでした。先日はその手作業の誤りが元で、お客様に対して過大請求や過小請求をしてしまい、迷惑をかけていました。その社員は夜遅くまで責任感を持って一所懸命頑張ったのに、全く報われていないなぁと思いました。そうこうす
たろう 木村
2024年12月8日読了時間: 4分


LangChainを用いて大量ファイルをロードするVectorDBを作ってみた
私が考えた構想は、フォルダの中の非定型ファイル群を一気に読込み、その情報を利用して生成AIに問いかけをするという仕組みでした。すなわちタイトルにある「大量ファイルをロードするVectorDB」の実現です。早速やってみようと思い、「Udemy」や「YouTube」を色々見てみましたが、「LangChain」を全く知らないことと、Pythonプログラミングもままならない状況でしたので、どこから手を付けてよいのか分からない状況でした。そんな中、LangChainに関するとってもわかりやすい書籍を見つけました。それが「LangChat完全入門」です。先ずはサンプルをそのままコーディングしてトライ&エラーを繰り返し、解説を読みながら少しずつ理解してきました。 ある程度コーディングをしていくと、「大量ファイルをロードするVectorDB」が作れるのでは?というようになりました。また、いろいろなWebサイトをみても、1つのPDFファイルやtextファイルを基にVectorDBへ情報を蓄積させるものはありましたが、大量ファイルを蓄積させるものは、探すことができま
たろう 木村
2024年12月8日読了時間: 1分
![ChatGPT/LangChainによるチャットシステム構築[実践]入門のプログラムを試す](https://static.wixstatic.com/media/2c388f_f36ff080af054555bed1c171704d94a4~mv2.jpeg/v1/fill/w_333,h_250,fp_0.50_0.50,q_30,blur_30,enc_avif,quality_auto/2c388f_f36ff080af054555bed1c171704d94a4~mv2.webp)
![ChatGPT/LangChainによるチャットシステム構築[実践]入門のプログラムを試す](https://static.wixstatic.com/media/2c388f_f36ff080af054555bed1c171704d94a4~mv2.jpeg/v1/fill/w_454,h_341,fp_0.50_0.50,q_90,enc_avif,quality_auto/2c388f_f36ff080af054555bed1c171704d94a4~mv2.webp)
ChatGPT/LangChainによるチャットシステム構築[実践]入門のプログラムを試す
現在私は「LangChain」のプログラムに沼っており(若い人が使う言葉ですね)、今回は「ChatGPT/LangChainによるチャットシステム構築[実践]入門」を読んで、いろいろプログラミングをして楽しむことにしました。 今まで私は「製造業の生産管理システム」や「プログラム言語の構文解析システム」など、いろいろなプログラミングをしてきたのですが、生成AI分野のように完全な正解が無く、常にアップデートしていくスタンスのものは初めてで、とても興味深いです。 この書籍通りにプログラミングを進めてみたのですが、何度も失敗を繰り返し、何度も心が折れそうになりました。。。これから生成AI分野を目指す方々がこの書籍を読んで楽しくプログラミングができる一助になればと思い、記事の投稿をしました。 詳しくはQiitaの記事をご覧ください https://qiita.com/ogi_kimura/items/0559f7d8d91c9a010eda
たろう 木村
2024年12月8日読了時間: 1分
bottom of page