【LangChain Interrupt参加レポート】Andrew Ng氏とHarrison Chase氏が語る「AIエージェントの現状と展望」

2025年5月13日から5月14日にかけてサンフランシスコで開催されたAIエージェント開発のテックイベント「LangChain Interrupt」。Day 2では、UberやBlackRockといった企業がLangGraphとLangSmith上でエンタープライズプラットフォームを構築している事例が紹介された後、AI分野の著名な研究者であり教育者でもあるDeepLearning.aiのAndrew Ng氏と、LangChainのCEOであるHarrison Chase氏による注目の対談「State of Agents」が行われました。

本記事では、AIエージェントの現状認識、開発トレンド、そして未来に向けた示唆に富んだこの対談の模様をお届けします。

はじめに:Andrew Ng氏とLangChainのご縁

対談の冒頭、Harrison Chase氏はAndrew Ng氏を紹介。CourseraやDeepLearning.aiのコースを通じて多くの開発者がAndrew氏から学んでいることに触れつつ、LangChainにとってもAndrew氏が大きな存在であったことを語りました。

Harrison Chase氏 「私がAndrewに会ったのは2年以上前、あるカンファレンスでLangChainについて話し始めた時です。Andrewは親切にも、DeepLearning.aiでLangChainに関するコースを作る機会を与えてくれたんです。確かDeepLearning.aiが手掛けた2つ目か3つ目のコースだったと思いますが、ここにいる多くの方々がそのコースを見たか、そのコースをきっかけにLangChainを始めたことでしょう。ですので、AndrewはLangChainの道のりにおいて非常に大きな存在であり、彼をステージにお迎えして、こうして対談できることを大変嬉しく思います。」

(I met Andrew a little over two years ago at a conference when we started talking about LangChain, and he graciously invited us to do a course on LinkedIn with deep learning, I think it must have been the second or third one that they ever did and they know a lot of people here, probably watch that course or got started on LinkedIn because of that course. So, Andrew has been a huge part of the LinkedIn journey and I'm super excited to welcome him on stage for a fireside chat so let's welcome, everyone.)

これに対し、Andrew Ng氏もLangChainチームがDeepLearning.aiで提供したコースの質の高さを称賛しました。

Andrew Ng氏 「Harrisonは本当に親切な人です。Harrisonと彼のチームは、これまでにDeepLearning.aiで6つのショートコースを教えてくれました。私たちのプラットフォームにあるコースの中でも、Harrisonたちのコースは特に評価が高いんです。だから、ぜひ6つのコース全てを受講してください。私自身、エージェントに関する多くの概念について、あれほど明確な説明は見たことがありません。」

(By the way, harrison is really kind of i think harrison And this team has taught six short courses so far on human deli and our metrics by never water school and so on that campus courses are most highly related, so So does he go take all six courses I think the clearest explanation I. See myself a bunch of agent concepts.)

「Agenticness」という概念について

Harrison Chase氏は、Andrew氏が提唱する「何かがエージェントであるかどうか」よりも「アプリケーションのエージェント的な度合い (Agenticness)」について話すという考え方に言及し、その意図と現在の考えを尋ねました。

Andrew Ng氏 「約1年半前、人々が『これはエージェントだ』『これはエージェントではない』と議論しているのを見ました。私は、コミュニティとして成功するためには、何かが『エージェント的 (Agentic)』である度合いが存在する、と言った方が良いと感じました。エージェント的なシステムを構築したいなら、少しの自律性でも、多くの自律性でも、どちらでも構いません。これら全てを、異なる程度の自律性を持つ『エージェント的なシステム (Agentic Systems)』と呼びましょう。この考え方によって、人々が『これはエージェントか、そうでないか』といった議論で時間を浪費することが減ったなら嬉しいですね。」

(About a year and a half ago, I saw that as long people are arguing, this is an agent, this is not a different arguments, not to an agent. And I felt that it was fine to have that argument, but that we would succeed better as a community, and just say that degrees to be something that's agentic. So and then we just say, if you want to build an agentic system, a little bit of autonomy or a lot of autonomy, is all fine. No need to spend time arguing. This is truly an agent let's just call all these things agentic systems with different degrees of autonomy. And I think that actually hopefully reduce the amount of time people wasted spent arguing something as an agent, and this is called all agentic.)

www.deeplearning.ai

Andrew氏によれば、この考え方は、人々が本質的でない定義論争に時間を費やすのを減らし、様々な度合いの自律性を持つシステム構築に集中できるようにすることを意図していたとのことです。

現在のAIエージェント構築のトレンドと課題

Harrison氏が、現在のエージェント構築が「少しの自律性」から「多くの自律性」というスペクトラムのどこに位置することが多いかを尋ねると、Andrew氏は興味深い見解を示しました。

Andrew Ng氏 「LangGraphは複雑なフローといった明白な問題に使われています。しかし率直に言うと、かなり直線的なワークフローや、時折分岐がある程度のシンプルなワークフローにも、膨大なビジネスチャンスがあるのを目にしています。…企業が抱える課題の一つは、ビジネスで行われていることを見て、それをエージェント的なワークフローに変える方法を見つけ出すのが依然として非常に難しいということです。タスクをどの程度の粒度でマイクロタスクに分解すべきか?そして、最初のプロトタイプを構築した後、それが十分に機能しない場合、どのステップの改善に注力すべきか?こうした一連のスキルセットを持つ人材は、まだ非常に少ないと思います。」

(Team uses land drop for obvious problems, right with complex flows and so on. I'm also seeing tons of business opportunities that, frankly, are fairly linear workflows, or linear with just occasional sign branches. ... one challenge I see businesses have is it's still pretty difficult to look at some stuff that's being done in business and figure out how to turn it into an agented workflow. So what is the granularity with which you should break down the spin into microtasks? And then, you know, after you build your initial prototype, if it doesn't work well enough, which of these steps do you work hard to improve the performance? So I think that whole bag of skills on how to look at a bunch of stuff that people are doing break into sequential steps. Where are the small number of branches? How do you put in place? Evals. You know all that that skill set is still far too rare, I think.)

多くのビジネスプロセスは、見た目よりも直線的であり、そこにAIエージェントを適用する大きな機会がある一方で、既存のプロセスをエージェントワークフローに落とし込み、評価し、改善していくスキルがまだ不足していると指摘しました。

エージェントビルダーに必要なスキル

エージェントビルダーが習得すべきスキルについて、Andrew氏は「良い答えを知っていれば良いのですが」と前置きしつつ、次のように語りました。

Andrew Ng氏 「システム全体のパフォーマンスだけでなく、個々のステップを追跡して、どのステップが機能しておらず、どのプロンプトが機能しておらず修正が必要なのかを特定できるような、適切な評価 (evals) フレームワークを導入することが重要です。多くのチームは、何かを変更するたびに、ただ大量のアウトプットを眺めて人間が評価するというやり方を、必要以上に長く続けてしまっています。ほとんどのチームは、体系的な評価を導入するのが遅すぎるように感じますね。…多くの場合、実際にアウトプットやトレースを見て、そこから判断を下さなければなりません。それはまだ非常に難しいことです。」

(Putting in place the rank evals framework to not only understand the performance of the overall system, but the trace the individual steps you can hone in on, what's the one step that is broken? What's the one prompt is broken to work on? I find that a lot of teams probably way longer than they should, just using human evals, where every time you change something, you then sit there and look at a bunch of awkward scenes, right? I see most teams probably slower to put in place evals, systematic evals in this idea... Often you're there, you know, look at the output, look at trace, look at the maximum output. And just got to make a decision, right to do things, and that's still very difficult.)

Andrew氏は、LLMの限界や製品のフレーミング、タスク分解といった「触覚的な知識 (Tactile Knowledge)」を効率的に得る難しさを指摘。AIツールがレゴブロックのように増え、それらを組み合わせてクールなものを作れるようになった一方で、どのブロックをどう使うか、特にEvalsをどう設計・導入するかといった実践的な知識が依然として重要であると強調しました。また、LLMの進化(例:コンテキストウィンドウの拡大)に伴い、過去のベストプラクティスが現在では通用しなくなる可能性も示唆しました。

過小評価されている技術:EvalsとVoice Stack

Harrison氏が、現在過小評価されているものの、注目すべき技術について尋ねると、Andrew氏はまずEvals(評価)を挙げました。

Andrew Ng氏 「Evalsについて人々は話しますが、なぜか実行しません。…Evalsは20分程度で本当に手早く作れるもので、それほど出来が良くなくても、私自身が目で見て評価するのを補完し始めることができるんです。…最初はほとんど役に立たないような雑なEvalsを作り、それがどう機能するかを見て、『このEvalsはダメだな。こうすれば修正できる』と考えて改善を重ね、より良いものにしていくのです。」

(Even though people talk about evals, for some reason, people don't do it. ... I think evals is something together really quickly, you know, in 20 minutes. And it's not that good, but it starts to compliment my human eyeball evals. ... a lot of the way I build emails, I built really awful emails that barely helps. And then when you look at what it does, you go, you know what this email is broken. I could fix it, and you make improvement for you make it better.)

Evalsは完璧なものを目指すのではなく、まず簡単なものから始めて徐々に改善していくアプローチを推奨しました。

次にAndrew氏が挙げたのはボイススタック (Voice Stack) です。

Andrew Ng氏 「音声アプリケーションですね。私の友人の多くも、音声アプリケーションには非常にワクワクしています。多くの大企業が音声アプリケーションに本当に興奮しているのを見ています。…なぜか、このコミュニティには音声に取り組んでいる開発者もいますが、音声アプリケーションに対する開発者の関心は、エンタープライズでの需要の大きさに比べて、まだはるかに小さいように感じます。」

(Voice applications. A lot of my friends very set up on voice applications. I see a bunch of large enterprises really set up a voice applications. ... For some reason, while there are some developers in this community doing voice the amount of developer attention on voice that applications. There is software. That's one thing that feels much smaller than the large enterprise importance.)

音声はテキスト入力よりもユーザーの心理的ハードルが低く、特にレイテンシ制御などが課題となるものの、大きな可能性を秘めていると語りました。 さらに、AI支援コーディングの重要性にも触れ、開発者だけでなく、AI Fundでは受付係やCFO、弁護士に至るまで全員がコーディングを学ぶことで、コンピュータに何をさせたいかをより上手く伝えられるようになっているという事例を紹介しました。

MCP (Model Context Protocol) の可能性と課題

最近登場したMCP (Model Context Protocol) について、Andrew氏とAnthropic社が共同でショートコースをリリースしたことに触れつつ、その意義と課題について語りました。

Andrew Ng氏「MCPは素晴らしいと思います。市場には明確なニーズのギャップがあったと思いますし、OpenAIが採用したという事実も、その重要性を示しているでしょう。…MCPは、多くのツールやAPI呼び出し、そしてデータソースへの接続インターフェースを標準化しようとする、素晴らしい試みだと思います。…MCPは本当に素晴らしい第一歩であり、今まさに学ぶべきものだと考えています。…N個のモデルやエージェントとM個のデータソースがある場合、それら全てを統合するのにN×Mの労力がかかるのではなく、N+Mの労力で済むべきだ、という考え方は非常に重要になるでしょう。」

(I think MC is fantastic. I think it was very clear market gap. And you know that OpenAI adopted it also, I think speaks to the importance of this. ... MCP, I think, is a fantastic way to try to standardize the interface to lot of tools or API calls as well as data sources. ... I think MCP is a really fantastic first step. Definitely, currently learn about it. ... when you have, you know, n models or n agents and M data sources, it should not be n times m effort to do all the integrations to n plus m. And I think MCP is a fantastic first step.)

MCPはエージェントが様々なデータソースやツールに接続する際の「配管作業 (Plumbing)」を標準化し、効率化する可能性を秘めている一方で、現状では実装が未成熟であったり、プロトコル自体も初期段階であると指摘しました。将来的には、リソースの階層的な発見メカニズムなどが必要になるとの見解を示しました。

マルチエージェントシステムの現状

MCPの話題から派生し、マルチエージェントシステムについて、Andrew氏は現状ではまだ初期段階にあると述べました。

Andrew Ng氏「あるチームがマルチエージェントシステムを構築する場合、それはしばしば機能します。なぜなら、そのチーム内でエージェント群を構築し、それらが互いにプロトコルなどを理解し合っているからです。それは機能します。しかし、少なくとも現時点では、あるチームのエージェント群が、全く異なるチームのエージェント群と上手く連携したという事例は、まだそれほど多くは見ていませんね。私たちはまだその初期段階にいると思います。」

(When one team is building a multi agent system that often works because we build a bunch of agents, they agree with themselves. We understand the protocols and all that that works. But right now, at least at this moment in time, and maybe I'm off the number of examples I've seen of when you know one team's agent of collection, Agent successfully engages a totally different teams, Agent of collection of agents. I think we're a little bit early to that.)

チーム内で閉じたマルチエージェントシステムは機能するものの、異なるチーム間で連携するようなオープンなマルチエージェントシステムはまだ成功事例が少ないとの認識を示しました。

AIによるコーディング支援と「Vibe Coding」

最近話題の「Vibe Coding(バイブコーディング)」について、Andrew氏はその名称にはやや否定的ながらも、AIコーディング支援ツールの有効性を認めました。

Andrew Ng氏「私たちの多くは、もはやコードをほとんど見ずにコーディングしていますよね。これは素晴らしいことだと思います。ただ、それが『Vibe Coding』と呼ばれているのは残念ですね。なぜなら、多くの人に『ただ雰囲気でやればいい』という印象を与えてしまうからです。…この1年ほど、AIがコーディングを自動化するから学ぶ必要はない、とアドバイスする人がいましたが、これは過去数十年を振り返っても最悪のキャリアアドバイスの一つだったと思います。なぜなら、コーディングが簡単になればなるほど、より多くの人がコーディングを始めるようになるからです。」

(Many of us code with barely looking at the code, right? I think it's a fantastic thing to be doing. I think it's unfortunate that that called vibe coding, because it's leading a lot of people into thinking, just go the vibes, you know. ... over the last year, people have been advising others to not learn to code on the basis that AI will automate coding. I think we look back at some of the worst career advice, because over the last many decades, as coding this year, more people started to close.)

AIによってコーディングが容易になるほど、より多くの人がコーディングを学ぶべきであり、コンピュータに何をさせたいかを正確に伝える能力が将来ますます重要になると強調しました。Pythonのような適切なプログラミング言語を一つ学ぶことを依然として推奨しています。

AI Fundとスタートアップへのアドバイス

最後に、Harrison氏がAndrew氏の運営するAI Fundについて、スタートアップを目指す人々へのアドバイスを求めました。

Andrew Ng氏 「AI Fundでの経験から学んだことを振り返ると、スタートアップ成功の最大の予測因子はスピードだと思います。…そして2番目に重要な予測因子は、技術的な知識です。…本当に希少なのは、この技術が実際にどのように機能するのかという知識です。技術は非常に速く進化しているので、優れたマーケティング担当者には深い敬意を払っています。…しかし、そうした知識は比較的広まっており、最も希少なのは、技術が実際にどう機能するのかを真に理解している人材なのです。」

(Looking back on AI fund lessons learned, the number one, I would say the number one predictor of a startup subset is speed. ... And I think the number two predictor also very important is technical knowledge. ... the knowledge that's really rare is how this technology actually works. Technology evolves so quickly. So I have deep respect for the good market people. ... but that knowledge is more diffuse and the most rare, these ones, or someone that really understands how the technology works?)

熟練したチームが持つ実行スピードと、技術が実際にどのように機能するかを深く理解していることが、スタートアップ成功の鍵であると語りました。

まとめ

Andrew Ng氏とHarrison Chase氏の対談は、AIエージェント開発の現状における課題、注目すべき技術トレンド、そして将来に向けた重要な視点が凝縮された、非常に示唆に富む内容でした。特に、Evalsの早期導入の重要性、Voice Stackの未開拓な可能性、そしてAI時代におけるコーディングスキルの普遍的な価値といった指摘は、多くのAI開発者にとって貴重な指針となるでしょう。また、MCPやマルチエージェントシステムといった新しいコンセプトに対する冷静な現状認識と将来への期待は、技術の進化を見極める上で参考になるものでした。この対談は、AIエージェントの未来を形作る上で、開発者がどのような視点を持ち、何に注力すべきかを改めて考えさせられる機会となったのではないでしょうか。