跳转至

ChainStream Agent开发指南

摘要

此开发指南提供了详细的步骤和指导,帮助开发者利用 ChainStream 框架管理数据流和创建Agent。通过这些指南,开发者能够有效地利用 ChainStream API 和模块开发Agent,实现高效的数据流处理和响应机制,从而满足各种复杂数据任务的需求。

Chainstream Agent开发模块介绍

Stream 模块

  • 描述:Stream 类是数据流的核心,每一个数据流都是 Stream 的实例,通过 stream_id 区分不同的数据流。ChainStream 通过挂载监听函数到数据流上完成对数据的监听与处理。
  • API
  • chainstream.get_stream(stream_id): 根据 stream_id 获取一个 Stream 对象,通常在构建 Agent 实例时需要使用此方法获取输入和输出流。
  • chainstream.create_stream(stream_id): 创建一个新的数据流,并返回 Stream 实例,以 stream_id 作为标识符。
  • chainstream.stream.Stream.for_each(agent, listener_func): 向 Stream 实例挂载监听函数。
  • chainstream.stream.Stream.unregister_all(agent): 注销数据流上挂载的监听函数。
  • chainstream.stream.Stream.add_item(data): 向数据流推送数据。

Agent 模块

  • 描述:需要创建一个或多个 Agent 来完成用户指定的任务。Agent 实例需要继承 chainstream.agent.Agent 类,并向父类传入 agent_id 作为标识符,并实现 __init__, start(), stop() 方法完成对相关数据流的监听、处理和结果输出。
  • API
  • __init__(agent_id): 实例化一个新的 Agent 对象来创建完成任务的 Agent,agent_id 是必要的参数,用于指定 Agent 的标识符,需要传入父类中。在该方法中,您可以初始化资源和数据流。
  • start(): 定义处理数据流的监听函数,并将其绑定到相应的数据流上。
  • stop(): 注销该 Agent 挂载到数据流上的所有监听函数。

BufferContext 模块

  • 描述:如果需要对处理后的数据进行存储,可以使用 BufferContext 模块创建数据容器,这个数据容器是一个队列,只能在队尾添加数据,队首取出存储的数据。
  • API
  • chainstream.context.BufferContext(): 实例化一个新的 BufferContext 对象来创建数据容器。
  • chainstream.context.BufferContext.add(data): 向数据容器的队尾添加数据。
  • chainstream.context.BufferContext.get(): 取出数据容器队首的数据。

LLM 模块

  • 描述:LLM 模块集成了多种模型,可以处理多种类型的输入数据,包括文本、图像和声音。模型会根据输入的处理要求以及提供的数据进行相应的回复。
  • API
  • chainstream.llm.get_model(type): 实例化一个 LLM 对象,获得处理数据的模型。
  • chainstream.llm.make_prompt(query ,data): 将处理要求和输入数据转换成模型能够接受的输入。
  • chainstream.llm.query(prompt): 向模型发送输入 prompt,返回模型的回复。

Agent 开发指南

Agent_id

在 Chainstream 中,Agent_id 是用来唯一标识一个 Agent 实例的字符串。

通常在创建 Agent 时,需要为其指定一个唯一的 Agent_id,以便在系统中识别和管理不同的 Agent。

  • Agent_id 可以是任何符合命名规范的字符串,如 test_agent, arxiv_processor 等。
  • 为了避免冲突,建议使用具有描述性的名称,并避免使用特殊字符或空格。

API 使用

  • 创建新的 Agent 时,需要继承 chainstream.agent.Agent 类,并实现其中的方法。
  • __init__ 方法中,需要调用父类的构造方法,并初始化资源和数据流。
  • start 方法中,定义处理数据流的监听函数,并将其绑定到相应的数据流上。
  • 除了监听函数外,通常需要进行数据预处理、解析、模型查询、响应处理和格式转换等步骤。
  • stop 方法中,注销该 Agent 挂载到数据流上的所有监听函数。

命名规则

遵循 Python 的命名规范,包括模块、类、函数和变量的命名。

  • 使用小写字母和下划线 _ 分隔的方式命名模块和文件。
  • 类名使用驼峰命名法。
  • 函数和变量名使用小写字母和下划线 _ 分隔。

示例Agent

成功案例

下面展示如何在ChainStream中实现一个提取Arxiv摘要的agent,让我们利用提供的API并参考开发指南行动起来吧!

import chainstream as cs
from chainstream.llm import get_model

class TestAgent(cs.agent.Agent):
    def __init__(self):
        super().__init__("arxiv_abstract_agent")
        self.input_stream = cs.get_stream("all_arxiv")
        self.output_stream = cs.get_stream("cs_arxiv")
        self.llm = get_model(["text"])

    def start(self):
        def process_paper(paper):
            paper_content = paper["abstract"]
            prompt = "Is this abstract related to edge LLM agent? Say 'yes' or 'no'."
            prompt = [{"role": "user", "content": prompt+paper_content}]
            response = self.llm.query(prompt)
            print(response)
            if response == 'Yes':
                print(paper)
                self.output_stream.add_item(paper)

        self.input_stream.for_each(self, process_paper)

    def stop(self):
        self.input_stream.unregister_all(self)