分类归档

AI教程

ChatGPT、Copilot、xAI、Meta AI 等

FWQ
AI教程
DeepSeek GRPO实现信息提取
自 DeepSeek R1 发布以来,我一直在复现它,以下是我获得的早期见解。 我主要关注信息提取,特别是零样本文本到图形提取。这是一项任务,当给出实体和关系类型列表时,我们会从目标文本中提取实体列表及其之间的关系。 文本到图输出的示例 { "entities": [ { "id": 0, "text": "Microsoft", "type": "company" }, { "id": 1, "text": "Satya Nadella", "type": "person" }, { "id":…
2025-02-16 阅读全文 →
FWQ
AI教程
金融分析多智能体系统
大家正在谈论大型语言模型(LLMs)和AI代理。在金融领域,这些不仅仅是流行语——它们是能够提供更深入市场洞察的工具。当我们构建QuantJourney时——这是为零售投资者和量化分析师提供的最全面框架时,我们相信投资者需要上下文感知的基于GPT的可适应系统,而不仅仅是提供原始数据。 1、我们为什么要建立这个 想象一下专业投资团队的工作方式。你有专注于不同领域的分析师——一些专注于技术分析,另一些专注于基本面,还有一些关注市场情绪。每个人都带来自己的专业知识,但真正的价值在于他们如何合作,共享见解并形成完整的图景。 这正是我们多智能体系统背后的概念。与其使用一个通用的人工智能来完成所有任务,我们使用专门的智能体(就像真实投资团队中的专家)进行协作、共享上下文并提供更细致的分析。 2、它是如何工作的 让我们通过一个真实的例子来分解它。假设你想分析苹果公司(AAPL)。在传统系统中,你可能需要: 查看当前股票价格 拉取财务报表 检查技术指标 阅读最近新闻 查看机构持股情况 在我们的系统中,当你询问关于AAPL时,经理智能体(“团队领导”)会协调预建的专门智能体——同时确保所有其他智能体保持共享的上下文并且输出连贯: 股价智能体(从FMP获取实时数据) 财务报表智能体(检查基本面) 收入报表智能体 资产负债表智能体 现金流量报表智能体 技术分析智能体(识别模式和技术信号) 估值智能体(关于行业、估值等) 市场分析师智能体(检查分析师推荐等) 新闻智能体(扫描最新发展和情绪) 但它们不是孤立工作的。例如,如果技术分析智能体发现异常的价格变动,它可能会通知新闻智能体寻找解释。如果利润率下降,行业分析智能体会检查这是否是一个全行业的问题还是特定于公司的。 例如:“当技术分析智能体识别到高波动性时,它会标记市场分析师智能体,后者评估近期宏观经济新闻是否可能是原因。这种互动确保了洞察力是全面且可操作的。” 看看它是如何在管道中组织的: 3、实际应用 你得到的是上下文洞察力,而不是零散的信息。对于一只股票,我们的系统将考虑: 当前市场表现的背景 基本面对比同行…
2025-02-16 阅读全文 →
FWQ
AI教程
CLIP模型微调简明教程
这是关于多模态 AI 的大型系列文章中的第 4 篇。在上一篇文章中,我们讨论了多模态 RAG 系统,它可以从不同的数据模态(例如文本、图像、音频)中检索和合成信息。在那里,我们看到了如何使用 CLIP 实现这样的系统。然而,这种方法的一个问题是,通用嵌入模型(如 CLIP)的向量搜索结果在特定领域的用例中可能表现不佳。 在本文中,我将讨论如何通过微调多模态嵌入模型来缓解这些问题。 多模态嵌入表示同一向量空间中的多种数据模态,因此相似的概念位于同一位置。下面显示了一个直观的示例,其中语义相似的项目(例如狗的图片及其对应的标题)很接近,而不相似的项目(例如猫的图片和描述狗的标题)相距很远。 CLIP 是一种流行的多模态嵌入模型,它使用对比学习在大量图像-标题对语料库上进行训练。 CLIP 的关键见解是,这种模型可以解锁零样本能力,例如图像分类、搜索和字幕 [1]。 这里的其中一个限制是 CLIP 的零样本能力可能无法很好地转移到涉及专业信息的领域,例如建筑图纸、医学成像和技术术语。在这种情况下,我们可以通过微调来提高 CLIP 的性能。 1、CLIP微调概述 微调涉及通过额外的训练将模型调整到特定用例。这很强大,因为它使我们能够在现有的最先进模型的基础上构建功能强大的专用模型,并且数据量相对较小。 我们可以通过以下关键步骤使用 CLIP 实现此目的。 收集文本-图像训练对…
2025-02-16 阅读全文 →
FWQ
AI教程
DeepSeek R1纯净版本地运行指南
开源语言模型的兴起使强大的AI工具更加普及,让开发者、研究人员和爱好者能够试验尖端技术,而无需依赖基于云的API。在这些创新中,deepseek-r1-abliterated 作为DeepSeek第一代推理模型的一个突破性的纯净变体脱颖而出。本文探讨了该模型的独特之处及其与原始DeepSeek R1的关系,并介绍了如何使用Ollama在本地运行它。 1、什么是deepseek-r1-abliterated? 是DeepSeek R1模型的一个干净的版本,这是一种为高级推理任务设计的最先进语言模型。原始的DeepSeek R1因其性能可与OpenAI的o1等专有模型相媲美而受到关注,但它包括限制有害或敏感输出的安全机制。通过“abliteration”过程,“abliterated”版本去除了这些安全措施,生成的内容没有预定义的限制。 这种方法允许用户探索创意、争议性或利基应用,同时保留原始模型的核心推理能力。然而,这种自由伴随着伦理责任,因为该模型可能会产生不适当或不安全的内容,如果没有适当的监督。 在本地部署deepseek-r1-abliterated提供了几个优势: 隐私:数据永远不会离开你的机器,这对于敏感应用至关重要。 节省成本:避免与基于云的模型相关的每次API费用。 定制化:通过系统提示和参数定制模型的行为。 离线使用:无需互联网连接即可运行。 像Ollama这样的工具简化了本地部署,让用户能够轻松管理并运行大型语言模型(LLMs)。 2、原始DeepSeek R1:简要概述 是一种创新工具,因其强大的未经审查的搜索和查询功能而受到关注。专为开发者和数据爱好者设计,DeepSeek R1让你可以绕过传统限制,访问未过滤的原始数据。这种自由对于需要全面洞察力的项目特别有益。 凭借其强大的架构,DeepSeek R1提供了不受审查算法约束的快速搜索功能。这一独特功能让用户能够深入研究数据集,探索广泛的结果,并执行对研究和开发至关重要的高级查询。 Deepseek R1的优点包括: 推理能力:在AIME和MATH等基准测试中优于许多模型。 成本效益:开放权重减少了对昂贵云服务的依赖。 灵活性:兼容本地部署和自定义。 然而,其内置的安全过滤器限制了其在无限制实验中的实用性——这一缺口由abliterated版本填补。 2、Abliteration提纯过程 Abliteration…
2025-02-16 阅读全文 →
FWQ
AI教程
用Unsloth训练自己的R1推理模型
今天,我们很高兴在 Unsloth 中引入推理功能!DeepSeek 的 R1 研究揭示了一个“顿悟时刻”,其中 R1-Zero 通过使用群组相对策略优化 (GRPO) 自主学习分配更多思考时间而无需人工反馈。 我们增强了整个 GRPO 流程,使其使用的 VRAM 比 Hugging Face + FA2 少 80%。这样你就可以使用 Qwen2.5 (1.5B) 在仅 7GB 的 VRAM 上重现…
2025-02-16 阅读全文 →
FWQ
AI教程
EXO:用消费级硬件运行AI集群
在这篇博文中,我们将深入探讨 EXO Labs 如何使用家用设备实现 AI 推理任务的划分和分配。我们将探索核心组件及其功能。最后,我们将介绍使用你拥有的设备设置自己的 AI 集群的步骤。 从本质上讲,EXO 将大型 AI 模型拆分成较小的部分(“碎片”)并将它们分布在多个设备上。可以把它想象成一场接力赛,每个跑步者(设备)处理旅程的一部分(模型处理)。 1、EXO的工作原理 关键组件: 碎片管理:EXO 将 AI 模型分成可管理的块。 智能分区:系统根据每台设备的功能找出最佳的任务分割方式。 gRPC 通信:设备使用这种高速协议相互通信。 环形拓扑:数据以环形流动,每台设备先处理自己的部分,然后再传递。 任务如何在网络中流动: 你提出问题:向 EXO 网络发送提示。 任务分配:系统将你的请求分割到可用设备中。 处理:每台设备都在其模型部分上工作。结果编译:一台设备收集所有部分并组装最终答案。…
2025-02-16 阅读全文 →
FWQ
AI教程
基于大模型的合成数据生成
构建大规模、全面的数据集来测试 LLM 输出可能是一个费力、昂贵且具有挑战性的过程,尤其是从头开始构建时。但是,如果我告诉你,现在只需几分钟就可以生成通常花费数周精心制作的数千个高质量测试用例,你会怎么想? 合成数据生成利用 LLM 创建高质量数据,而无需手动收集、清理和标注大量数据集。借助 GPT-4 等模型,现在可以在更短的时间内合成生成比人工标记数据集更全面、更多样化的数据集,这些数据集可用于借助一些 LLM 评估指标对 LLM(系统)进行基准测试。 在本文中,我将教你有关如何使用 LLM 生成合成数据集(例如,可用于评估 RAG 管道)的所有知识。我们将探索: 合成生成方法(蒸馏和自我改进) 什么是数据演化、各种演化技术及其在合成数据生成中的作用 使用 LLM 从头开始​​创建高质量合成数据的分步教程。 如何使用 DeepEval 在不到 5 行代码中生成合成数据集。 感兴趣吗?让我们深入了解。 1、什么是使用…
2025-02-16 阅读全文 →
FWQ
AI教程
Smolagents:以代码为中心
正如你一定在多个地方读到的那样,2025 年是AI代理的一年。以至于马克·扎克伯格公开表示 Meta 将让AI代理担任中高级工程师。 从过去的几个版本中可以清楚地看出,微软现在拥有 3 个多代理编排框架(AutoGen、Magentic-One、Tiny-Troupe),OpenAI 发布了 Swarm,AWS 除了独立的 Langraph 和 CrewAI 之外还推出了多代理编排器。现在,就连 HuggingFace 也加入了推出“smolagents”的行列,这又是一个多代理框架,但有所不同。 1、什么是 smolagents? 是 Hugging Face 新推出的代理框架,旨在简化利用大型语言模型 (LLM) 的智能代理的创建。这个轻量级库使开发人员能够用最少的代码构建代理,专注于实用性和易用性。 Smolagents 的主要功能: 简单性:Smolagents 允许使用简单的编码方法快速进行原型设计和部署,即使是那些在创建代理方面经验有限的人也可以使用它。…
2025-02-16 阅读全文 →
FWQ
AI教程
AI 编码助手的真相
AI 编码助手的华丽营销承诺描绘了一幅诱人的画面:完美的代码生成、闪电般的开发速度,以及一个永不休息的数字伙伴。 但在与数百名开发者(包括来自三大洲的远程开发者)交谈后,我发现了一个更为复杂的现实,而硅谷的光鲜演示文稿却巧妙地忽略了这一点。 1、人工智能的诱惑 当 Mark Davidson(一位在财富 500 强公司拥有二十年经验的远程开发者)首次将 GitHub Copilot 集成到他的工作流程中时,他被迷住了。“感觉就像指尖上有一个读心者,”他回忆道,靠在西雅图家庭办公室的椅子上。“但三个月后,我注意到了一些令人不安的事情。” 根据的最新数据,78% 的开发者现在使用 AI 编码助手,而 2022 年这一比例仅为 27%。然而,在这些令人印象深刻的采用率背后,隐藏着一个复杂的成本网络。 2、技术债务的时间炸弹 最隐蔽的影响并不会立即体现在你的资产负债表上。卡内基梅隆大学软件工程研究所的表明,与传统编写的代码相比,AI 助手生成的代码可能会引入高达 35% 的技术债务。 “这就像在你的代码库上借了一笔高息贷款,”麻省理工学院计算机科学与人工智能实验室的首席研究员 Sarah Chen 博士解释道。“代码今天可以工作,但你正在以维护挑战的形式积累利息。”…
2025-02-16 阅读全文 →
FWQ
AI教程
OpenAPI – AI代理的工具接口
我最近探索了如何利用 OpenAPI 规范为 AI 代理提供可操作的功能。在这篇博客中,我旨在分享我的见解并展示这个过程。 1、OpenAPI规范简介 让我们从基础开始。 什么是 OpenAPI 规范? OpenAPI 规范是一个标准化的、与语言无关的框架,用于定义 HTTP API。它使人类和机器都能发现和理解服务的功能,而无需访问其源代码、详细文档或网络流量检查。正确定义的 OpenAPI 规范允许消费者以最少的实现逻辑与远程服务交互。在此处了解更多信息。 应该何时使用 OpenAPI 规范? 当你想将 AI 功能整合到现有 API 中时,OpenAPI 特别有用。许多企业已经拥有正在运行的 API。在当前的 AI 浪潮中,将…
2025-02-16 阅读全文 →