阅读anthropic building-effective-agents 文章有感而发

学习 

本文作者阅读了anthropic的"building-effective-agents"文章后有所感悟,探讨了智能创作、workflow和agent的相关内容。文章介绍了工作流程的预定义代码路径编排LLM和工具的系统,以及作者对agent核心的理解。作者认为,工具接口定义描述需要足够清晰,以便模型能够准确使用工具。同时,作者还讨论了模型返回结果的格式化控制问题。最后,作者表示将继续关注智能创作领域的agent发展,并欢迎大家关注其公众号进行讨论。

大升级!LLM应用监控、测试、优化一步到位!

学习 

本文介绍了使用langfuse工具在开发基于检索增强生成(RAG)模型应用时的监控追踪方法。文章详细描述了langfuse的功能,包括LLM可观测性、提示管理、LLM评估、数据集管理等。文章还介绍了langfuse最近的v3.0.0大版本升级,包括引入Async Worker、Redis、Clickhouse和S3 / Blob Storage等技术来提升系统的可扩展性、性能和数据处理能力。文章通过实例展示了如何使用langfuse进行trace、提示词管理,并总结了langfuse在LLM应用开发生态系统中的作用。最后,文章呼吁读者关注公众号并分享使用langfuse的经验和想法。

微软开源的处理工具 - markitdown

学习 

微软最近开源了一个名为markitdown的Python工具,可将各种格式的文件和office相关格式的文件转换为Markdown格式。它支持多种文件格式转换,如PDF、PowerPoint、Word、Excel、图片、音频等。此外,markitdown还支持调用大模型处理图片、音视频等格式的文件数据。该工具的安装简单,并且提供了高级用法和API接口,方便集成到内部流程、数据管道或知识管理系统中。其应用需求主要体现在非结构化数据转换、提高模型训练效率、复杂文档解析、知识管理和团队协作、数据源集成、在线文档与静态网站构建等方面。该工具为模型应用开发者提供了便捷的文件处理解决方案。

ChatGpt崩了,Gemini 2.0上线


今天上午访问ChatGPT时服务似乎出现故障,疑似因能源问题导致。与此同时,谷歌发布了Gemini 2.0,作为科技前沿的重大更新。Gemini 2.0在多模态方面取得了显著进展,能够理解和处理文本、图像、音频和代码中的信息。其主要特点包括性能提升、多模态输入与输出、原生工具使用、集成了文本转语音和图像生成的Gemini 2.0 Flash模型,以及与责任与安全委员会的协作以确保负责任的AI开发。此外,谷歌还推出了三个智能体研究原型和新的Multimodal Live API。