-
LangGraph FastAPI 和 StreamlitGradioLLM 驱动应用的完美三重奏
在我开始之前,快速插入一个🔌 :-)这是关于 LangChain 初学者系列的第 5 篇博客。我通过这些帖子记录我的 GenAI 学习(顺便提一下,我的背景是土木工程和机器学习)。我承诺会让内容简单易懂,适合像我一样的初学者,并随着每一篇新帖子逐步... -
认识HUSKY一种针对多步骤推理优化的新代理
来自Meta AI、Allen AI和华盛顿大学的新研究解决了LLM推理中最重要的问题之一。推理被广泛认为是生成AI的下一个前沿领域。我们所指的推理是将任务分解为更小的子集并单独解决的能力。Chain-of-Thought、Tree-of-Thoug... -
我在10多个AI工程师职位面试中的6个令人惊讶的观察结果
个人经历在人工智能时代变得无价。人工智能工程师目前的需求量很大。 由于我参加了10多次人工智能工程师职位的面试,我决定在这篇文章中分享我的经历。我的经验对那些希望进入人工智能领域的人将会有所帮助。 随着大量人工智能生成内容的出现,分享个人经验和观察变... -
使用 LlamaindexNeo4j 和 Llama 3 构建高级 RAG 聊天机器人
逐步指南,介绍如何通过集成知识图谱构建高级检索增强生成(RAG)聊天机器人。 什么是 RAG? 检索增强生成(RAG)是一种先进的技术,结合了基于检索的模型和生成模型,以提高生成响应的质量和相关性。它特别适用于问答等应用,其中系统需要提供详细且上下文... -
在Android上使用Gemma 2B进行设备端LLM处理 AI聊天应用
随着大型语言模型(LLMs)的不断进步,将它们集成到移动应用中变得越来越可行且有益。设备端LLM处理具有多种优势,如降低延迟、增强隐私保护和离线功能。 通过直接在设备上运行LLMs,应用程序可以提供实时响应,无需依赖持续的互联网连接或将敏感数据暴露给... -
高级RAG 12增强全球理解
原理、代码解释与洞察许多重要的现实任务,包括科学文献综述、法律案件简报和医学诊断,都需要跨片段或文档的知识理解。 现有的RAG方法无法帮助LLMs完成需要跨片段边界理解信息的任务,因为每个片段都是独立编码的。 本文将介绍四种创新方法,以增强文档或语料... -
构建LLM应用清晰的分步指南
构建LLM原生应用的综合步骤:从初始想法到实验、评估和产品化大型语言模型(LLMs)正迅速成为现代AI的基石。然而,目前尚无公认的最佳实践,先行者往往面临无明确路线图的困境,需要重新发明轮子或陷入僵局。 在过去两年中,我协助多家组织利用LLMs构建创... -
如何使用 RAGAs 框架评估您的 RAG
LLM 双胞胎课程:构建生产就绪的AI复制品如何使用RAGAs框架评估你的RAG学习使用 RAGAs 框架,遵循行业最佳实践评估您的 RAG 模型。了解检索与生成特定指标,以及利用 CometML LLM 进行高级 RAG 链监控。→ LLM Twi... -
如何使用Llama 3构建本地文件的生成式搜索引擎
使用Qdrant、Nvidia NIM API或Llama 3 8B在本地搭建你的GenAI助手5月23日,我收到了来自Nvidia的一位人士的邮件,邀请我参加NVIDIA与LangChain联合举办的生成式AI代理开发者大赛 。起初,我觉得时间相当... -
作为产品经理我在工作中是如何实际使用ChatGPT的
剧透警告:不,我并不是用它来想出新的产品功能。当我开始遇到标题为“产品经理会被人工智能取代吗?”的帖子时,我知道我在阅读 Reddit 的时间太长了。 长期来看?像 30 年后?谁知道呢。这个角色很可能会由于我永远无法预测的多种因素而演变。 短期来看...