「AIエージェントキャッチアップ #47 - Deep Agents (LangChain)」を開催しました

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #47 - Deep Agents (LangChain)」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Deep Agents 今回は、よく使われて…

「AIエージェントキャッチアップ #46 - DSPy v3」を開催しました

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #46 - DSPy v3」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com DSPy v3 今回は、先日v3がリリースされた、プロンプ…

「AIエージェントキャッチアップ #45 - Serena」を開催しました

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #45 - Serena」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Serena 今回は、コーディングエージェントツールキッ…

「AIエージェントキャッチアップ #44 - Strands Agents」を開催しました

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #44 - Strands Agents」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Strands Agents 今回は、AWS製のフレームワー…

「AIエージェントキャッチアップ #43 - BrowserGym」を開催しました

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #43 - BrowserGym」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com BrowserGym 今回は、Webエージェント研究のための…

Mistral AIのスピーチアンダースタンディングモデル「Voxtral-Mini-3B」の日本語認識能力を検証してみた

ジェネラティブエージェンツの西見です。 2025年7月にMistral AIからスピーチアンダースタンディングモデル(speech understanding model)「Voxtral-Mini-3B」がリリースされました。「Introducing the world's best (and open) speech recognition models!…

Amazon Bedrock AgentCoreを一通りさわり倒してみる ~ Code Interpreter 編 ~

ジェネラティブエージェンツの遠藤です。 先日発表されたAmazon Bedrock AgentCore、まさに「これ欲しかったやつ!!」の塊で、いろいろな機能を試すたびにテンションが爆上がりしています・・・! その勢いで始めた『一通りさわり倒してみる』シリーズ、今…

拡散モデルによるコード生成モデル「Dream-Coder 7B」をmacOSで動かして他モデルと比較してみた

ジェネラティブエージェンツの西見です。 Googleが発表した拡散モデルを利用した言語モデル「Gemini Diffusion」があまりにも爆速で動作していたのは記憶に新しいです。 deepmind.google そんな中、2025年7月15日に拡散モデルベースのオープンウェイトのLLM…

「AIエージェントキャッチアップ #42 - GenAI Processors」を開催しました

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #42 - GenAI Processors」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com GenAI Processors 今回は、Google DeepMind…

仕様書とコードの「意味的な整合性」を検証するツール『Semcheck』の利用モデル別性能評価

ジェネラティブエージェンツの西見です。 Claude Codeなどのコーディングエージェントを活用するためには、的確な指示だけでなく、エージェントが生成したコードの誤りを自律的に検知・修正する仕組みが重要となります。誤り検知には自動テストやLinterが有…

Amazon Bedrock AgentCoreを一通りさわり倒してみる ~ Memory編 ~

ジェネラティブエージェンツの遠藤です。 Amazon Bedrock AgentCoreは、まさに「これ欲しかったやつ!!」の塊で、テンションが爆上がりしています・・・! そんな勢いで始めた『一通りさわり倒してみる』シリーズ、今回はAgentCore Memory編をお届けします…

Amazon Bedrock AgentCoreを一通りさわり倒してみる ~ 全体の感想とRuntime編 ~

ジェネラティブエージェンツの遠藤です。 7月にジョインしたばかりなので初めましての方が多いと思いますが、今後ともよろしくお願いします! 発表されたばかりのAmazon Bedrock AgentCore (Preview)のドキュメントを一通り読んだところ、「これ欲しかったや…

Kimi K2をLLMエージェントで活用する場合の性能を検証してみた

ジェネラティブエージェンツの西見です。 最近「Open Agentic Intelligence」としてリリースされたKimi K2が気になったので、LLMエージェントとして利用した場合にどうなるか試してみました。GPT-4.1(Azure OpenAI Service経由)とClaude Sonnet 4と一緒に…

「AIエージェントキャッチアップ #41 - Awesome Claude Code」を開催しました

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #41 - Awesome Claude Code」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Awesome Claude Code 今回は、Claude Co…