GenAI > MCP

MCP

MCP是一种开放协议，它标准化了应用程序向大型语言模型(LLM)提供上下文的方式。可以将MCP想象成AI应用的USB-C接口。就像USB-C为设备连接各种外设和附件提供标准化方式一样，MCP为AI模型连接不同数据源和工具提供了标准化方法。

为了深入理解MCP，我们需要先回顾一下LLM和AI应用的历史发展。

LLM本质上只是简单的token生成器。它们只是逐个预测下一个token，本质上是文本生成器。这一点并不总是那么显而易见，因为在如今具有代理行为(Agentic)的系统中，人们往往认为LLM具有超能力，可以完成各种任务。

但实际情况是：

例如，当你使用ChatGPT并启用网络搜索选项时，背后实际是OpenAI工程师编写的外部代码在工作，而非LLM本身的能力。

LLM工具调用的工作原理是：

这就是几乎所有AI代理的基本功能。需要注意的是，由于LLM是基于统计的系统，工具调用机制并不能保证100%正确，但在大多数情况下效果相当不错。

第一步，“使用精心设计的系统提示”，下面是一个示例：

注意第二条和第五条，它是整个Agentic工具的核心工作原理

MCP让开发者可以专注于编写这些工具并将它们暴露在MCP服务器中。我们编写的这些工具可以被所有支持函数调用的应用程序使用，包括:

MCP实质上是简化了开发者创建和部署可供大型语言模型调用的工具的平台，让专业功能可以更容易地集成到AI系统中。

让我们了解下MCP协议的核心机制，以及各组件之间如何交互协作。

在MCP协议架构中，有几个关键组件：

值得注意的是，一个APP应用可以包含多个MCP客户端，每个客户端连接到不同的MCP服务器。

当我们启动应用程序时，首先发生的是连接建立：

这一切都发生在用户交互之前，是应用启动时的预处理阶段

当用户发送查询后：

这是MCP与其他框架(如LangChain)的关键区别：

这种解耦设计使系统更易扩展、监控和部署

最终答案通过应用程序呈现给用户