分类归档

AI教程

ChatGPT、Copilot、xAI、Meta AI 等

FWQ
AI教程
AI开发必备的3个DSPy技巧
DSPy 是我的首选框架,因为它简单且设计周到。我使用它做了很多事情,从构建 MVP 到扩展系统以处理数百万个请求。虽然 DSPy 和 AI 编程仍在不断发展,但找到清晰、可用于生产的指导可能很困难。 在这篇博客中,我分享了我所学到的东西——从实践经验到文档和 GitHub 讨论中的见解。这是一本实用指南,里面充满了使用 DSPy 的可行技巧。 1、可靠的输出 对于使用 LLM 的开发人员来说,最大的挑战是实现结构化和一致的输出。让你的代理工作是一回事,但确保 95% 以上的可靠性是另一回事。最终用户每次都希望获得良好的结果 — 他们不在乎 LLM 是否容易出现幻觉、不一致或偶尔出现不稳定行为。 虽然有些问题(如 API 提供商中断)超出了你的控制范围,但你可以在自己这边解决许多问题。使用 DSPy,你可以使用断言和建议来指导你的程序获得更好的输出并提高可靠性。这些工具还有助于捕获不良结果并实施自动重试机制以确保高质量的响应。 如何使用…
2025-02-16 阅读全文 →
FWQ
AI教程
DeepSeek R1-Zero & R1分析
我们还没有 AGI,创新仍然受到限制——扩大纯 LLM 预训练并不是出路,尽管这是去年夏天人工智能行业的主流叙事和主流公众观点。 叙事之所以重要,是因为它们最终会推动经济活动,如投资、研究重点、资金、地缘政治、贸易等。例如,在 2023-24 年,新 LLM 初创公司的投资约为 200 亿美元,而新 AGI 初创公司的投资仅为约 2 亿美元。 我们于去年 6 月推出了 ARC Prize 2024,以提高人们对 LLM 扩展限制的认识,并推动一个有用的基准 ARC-AGI-1 朝着新的方向发展,即要求 AI 系统适应新的、看不见的问题,而不是严格依赖记忆。 1、DeepSeek…
2025-02-16 阅读全文 →
FWQ
AI教程
用GRPO算法训练医疗AI模型
大型语言模型(LLMs)与医疗保健的交叉点带来了令人兴奋的机会,但也带来了独特的挑战。在本教程中,我们将探讨如何使用分组相对策略优化(GRPO)——一种最近由DeepSeek团队引入的有前途的新强化学习技术——来适应阿里巴巴的Qwen-3B模型以用于医学推理。 为什么这很重要: 患者安全第一:医学AI中的幻觉可能是危险的。 领域专业化:通用LLMs难以处理临床推理。 效率:我们的3B参数模型可以在消费级GPU上运行。 推理模型如O3和DeepSeek R1在许多具有挑战性的基准测试中显示了前所未有的改进。它们改变了监督微调的趋势,转向实际的强化学习(RL)。我们在深度学习领域的许多突破都来自RL,例如AlphaGo,因为模型能够通过与不同的现实场景互动来学习,而这些场景在监督微调中往往难以提供示例。 DeepSeek R1在几个关键基准上的表现 。 如果你想了解更多关于推理模型或更多历史细节,我强烈推荐Maarten的文章。DeepSeek工作的美妙之处在于他们实现了一个实用的框架,用于使用GRPO对LLM进行微调。根据Maarten的文章: 这个算法背后的直觉是,它使所有导致正确或错误答案的选择更可能或更不可能。这些选择可以是令牌集也可以是推理步骤。 正如下面的图片所示:目标是激励模型生成响应,使其在正确的*和*块中以及我们能够轻松验证的最终正确答案中都能产生良好的结果(如数学问题)。 DeepSeek-R1-Zero使用的RL管道 好了,背景知识就到这里,让我们开始动手吧。本文使用的代码作为提供,你可以轻松地使用T4免费资源运行。 1、安装Unsloth和TRL 开源软件已经取得了很大进展——在这个教程中,我们将使用两个出色的开源库: : 一个帮助我们从GPU中尽可能多地提取内存并提高训练性能的库。 : 来自Hugging Face的一个开源库,帮助我们实现GRPO。 我们还将使用Qlora技术,帮助我们以更高效的方式微调模型。如果你想了解更多关于Qlora的信息,我强烈推荐Sebastian的文章。 !pip install unsloth vllm #…
2025-02-16 阅读全文 →
FWQ
AI教程
基于CrewAI的合成数据生成
很多时候,在使用不同的 AI 代理框架时,我们对模型性能并不满意。通常,我们需要一个在特定领域或领域中工作的 AI 代理解决方案。模型本身也可能如此。 本文介绍了一个使用 CrewAI 代理生成合成数据的综合框架,以应对这些挑战。通过模拟基于代理的交互,CrewAI 使我们能够生成针对特定任务量身定制的真实数据集,从而显著提高机器学习模型的性能。本详细指南将引导你完成整个过程,从设置环境到生成和使用合成数据来微调模型。 开源模型(例如 Mistral、Llama 3、Phi-3 等)通过提供可以轻松针对特定任务进行微调的预训练模型,在 AI 民主化方面发挥了至关重要的作用。 然而,这些模型的性能高度依赖于训练数据的质量和相关性。在特定领域的数据集上对预训练模型进行微调已成为一种重要的技术,可使它们适应特定任务并提高其准确性(Radford 等人,2018 年)。传统的数据收集方法通常涉及手动标记和注释,这既耗时又昂贵,而且在场景多样性和覆盖范围方面也受到限制(Nikolenko,2019 年)。 如今,使用许多不同的框架(例如 Ollama、HuggingFace Transformers、crewAi 代理),可以将模型微调到你的特定领域或用例。 使用微调模型还有其他优势,例如推理成本。 1、概述 我提出的框架是通用的,可以轻松适应不同领域的不同用途。我将连同用于这样做的 Python 代码一起解释它。我将仅提供微调和…
2025-02-16 阅读全文 →
FWQ
AI教程
SmolAgents深入探索
SmolAgents 是 Hugging Face 的一个尖端库,允许开发人员创建能够解决复杂任务的智能、特定领域的代理。本博客将深入介绍 SmolAgents,包括工具、代码代理、安全代码执行和实际实现。我们还将结合代码示例使概念更清晰。 1、代理简介 在 AI 领域,代理是 LLM 输出控制工作流的程序。LLM 对系统操作的影响程度决定了其代理级别。这种代理存在于以下范围内: 无代理 ():LLM 输出不影响程序流程。 低代理 ():LLM 输出确定工作流中的条件分支。 中代理 ():LLM 输出决定执行哪些功能或工具。 高代理 ():LLM 输出控制迭代过程并可以启动其他代理工作流。 当任务需要基于动态输入进行调整的灵活工作流时,实施代理是有益的。但是,对于具有可预测和定义明确的流程的任务,传统的确定性编程可能就足够了。 !pip install…
2025-02-16 阅读全文 →
FWQ
AI教程
C++运行YOLO进行目标检测
本文是关于如何在CPU上运行YOLOv5模型,而不是GPU。要在GPU上运行模型,需要安装CUDA、CUDNN等,这可能会让人感到困惑且耗时。我将在未来写另一篇文章介绍如何在支持CUDA的情况下运行YOLO模型。 目前,你只需要安装OpenCV库。如果你还没有安装它,可以从这个安装。 那么,让我们开始吧。我会一步一步地讲解,完整的代码可以在页面底部查看。 1、导出YOLOv5模型为ONNX模型 创建一个新的文件夹并命名为你想要的名称。打开终端并将yolov5仓库克隆到该文件夹中。我们将使用此仓库导出模型为onnx格式。 git clone https://github.com/ultralytics/yolov5 我将使用yolov5s.pt模型,但你可以使用自定义的YOLOv5模型,过程不会改变。你可以从这个下载预训练模型,或者使用你自己的模型。如果你不知道如何训练自定义YOLO模型,不用担心,我已经有一篇文章介绍了这个内容,你可以查看它() 预训练YOLOv5模型 现在让我们将模型导出为onnx。有不同参数,你可以参考下面的图片。你可以编辑“”文件(yolov5/export.py),或者像我在这里一样手动更改参数。对于自定义模型,你需要将权重更改为你的自定义模型权重(your_model.pt文件)。 python yolov5/export.py --weights yolov5s.pt --img 640 --include onnx --opset 12 注意:你需要将opset设置为12,否则可能会报错。这是一个常见的问题,你可以在GitHub上查找此错误。 parameers/ export.py文件 2、创建TXT文件存储YOLO模型标签 这一步很简单,你只需要创建一个txt文件来存储标签。如果你使用的是预训练的YOLO模型,可以从此直接下载txt文件。如果你有一个自定义模型,则需要创建一个新的txt文件并在其中写入你的标签。你可以给这个文件命名任何你想要的名字,这并不重要。 coco-classes.txt 3、创建CMakeLists.txt文件…
2025-02-16 阅读全文 →
FWQ
AI教程
OpenAI Operator
在本文中,我将通过具有桌面和浏览器访问的 AI 代理的视角探索 OpenAI Operator,重点关注准确性、人工监督以及模型 (CUA) 和框架 (Operator) 之间的区别。最后,我将讨论未来需要牢记的关键挑战和重要注意事项。 最近发布了许多 AI 代理计算机接口 (ACI) 框架。 核心概念是 AI 代理驻留在用户的桌面上,使其能够通过 GUI 浏览 PC 和互联网。 将 GUI 视为 API 的人性化版本。此功能赋予 AI 代理无与伦比的自由,使其能够完全按照用户的设想执行任务。…
2025-02-16 阅读全文 →
FWQ
AI教程
5个文本/表格提取Python包
在当今的数字时代,从非结构化数据中提取有意义的信息对于各种应用至关重要。从 PDF 等文档中提取文本和表格在数据分析、信息检索和自动化任务中发挥着重要作用。 在这篇博文中,我们将深入研究 Python 中的文本和表格提取世界,探索可以简化这些过程的不同包。 0、光学字符识别 (OCR) 在深入研究提取包之前,让我们先了解一下光学字符识别 (OCR) 的基本概念。 OCR 是一种使计算机能够识别和提取图像或扫描文档中的文本的技术。它涉及一系列步骤,包括图像预处理、字符分割和字符识别。 文本检测和文本识别是两个基本组件,它们协同工作以在 OCR 中从图像或扫描文档中提取文本。让我们详细探讨每个部分: 文本检测涉及定位图像或文档中包含文本的区域或边界框。此步骤对于确定需要执行文本提取的关注区域至关重要。以下是文本检测过程的概述: 对象定位:应用对象定位算法来识别图像中可能包含文本的潜在区域。这些算法分析视觉特征,例如边缘、角和纹理图案,以确定可能包含文本的区域。 边界框生成:一旦识别出潜在的文本区域,就会在这些区域周围生成边界框。这些边界框定义了图像中文本的空间范围,并提供了一种隔离和提取文本以供进一步处理的方法。 一旦检测到文本区域,下一步就是执行文本识别,这涉及将检测到的文本区域转换为机器可读的文本。以下是文本识别过程的概述: 字符分割:在此步骤中,进一步分析文本区域以分割单个字符或文本行。这种分割对于将文本分成可以单独识别的较小单元是必要的。 特征提取:对于每个分割的字符或文本行,提取边缘、角或纹理图案等特征。这些特征有助于以有意义的方式表示文本单元的视觉特征。 字符识别:提取的特征用作字符识别算法的输入,例如机器学习模型或模式匹配技术。该算法将特征与预先训练的字符或字体集进行比较,并确定每个片段最可能的字符。 文本组合:一旦字符被单独识别,它们就会根据其在文本区域内的空间排列组合并组织成单词、句子或段落。此组合步骤可确保识别的字符按正确的顺序排列,以形成连贯且有意义的文本。 后处理:在文本识别步骤之后,可以应用其他后处理技术来细化识别的文本。这可以包括语言建模、拼写检查和上下文分析,以提高提取文本的准确性和连贯性。 文本提取包 1、Pytesseract Pytesseract…
2025-02-16 阅读全文 →
FWQ
AI教程
DeepSeek-R1本地运行成本
DeepSeek 将这场生成竞赛提升到了另一个水平,人们甚至准备在本地运行 671B 参数。但在本地运行如此庞大的模型可不是开玩笑;你需要在硬件方面取得一些重大进步,才能尝试推理。 这篇博客粗略地分析了在 PC 上运行 DeepSeek-R1 需要花费多少钱 1、硬件成本 大部分费用在于硬件。我们将讨论 GPU、CPU、RAM、SSD 存储、冷却系统等 GPU 4 个 NVIDIA H100 80GB GPU(每个 25,000 美元) 总成本:₹85,00,000(100,000 美元) 为什么?这些 GPU 是针对 AI…
2025-02-16 阅读全文 →
FWQ
AI教程
AI驱动的投资平台
两年前,我用Google Chrome和Charles Schwab登录账号开设了我的第一个投资账户。我对这一切一无所知——相信我,我的投资组合反映了这一点。随着我在股票选择和市场趋势中摸索,我的账户进一步陷入赤字。但当我更深入地进入投资世界时,我发现了一个改变游戏规则的东西:像Gemini和ChatGPT这样的AI工具。突然间,我可以比以往任何时候都更高效地进行深入的定性和定量研究。 看到这种方法早期的成功,我开始痴迷于完善我的策略。这段旅程最终将我带到了finciples.ai——一个拥有强大算法和数据驱动洞察力的AI驱动平台,它帮助我从一个挣扎的初学者转变为一个自信的投资者。让我来解释一下。 1、什么是Finciples.ai? 是一家使用大型语言模型(LLMs)评估公司基于定性和定量因素的小型初创企业。该平台提供三个主要功能:原则分析、AI顾问和传统分析。 2、原则分析(AI增强) Finciples.ai允许用户从传奇投资者中选择一组原则——比如本杰明·格雷厄姆和沃伦·巴菲特——或自己设定的一组原则。一旦你选择了自己的原则和想要分析的股票,你将获得一个总体评分以及基于每项原则与股票的契合度的单项评分。 例如,读了《聪明的投资者》之后,我爱上了本杰明·格雷厄姆。我也对Zoom进行了广泛的研究(查看我的文章),所以我希望利用AI来看看是否应该重新审视我之前所做的分析。当我将其输入网站时,它输出了这个分数: 这些分数为我作为投资者提供了很好的研究起点,了解公司的弱点和优势所在。但是,为了验证这一点,让我们用我选择投资的三大原则运行一下:公司有良好的管理系统、公司是行业领导者、公司具有折扣估值。当我用Open AI的Chat GPT运行这些原则时,我得到了一个完全不同的分数: 能够访问这些不同价值观和思维模式来选择投资,是finciples.ai真正的礼物,使我能够在任何时刻从不同的视角看待我的投资。这些分数也是我进一步研究的完美起点,更有效地筛选出具有真正潜力的股票,而不仅仅是使用简单的估值比率。 3、AI顾问(AI主导) 与原则分析中的AI增强不同,AI顾问只需要输入一个股票代码,AI就会给出它对该股票的看法。它会为你挑选所有原则并根据所选的LLM对股票的看法输出一个投资评分。这个工具非常适合快速了解股票的潜力,而不是专注于测试你最喜欢的原则。 对于Zoom来说,AI顾问输出的内容如下: 4、传统分析 和其他许多金融平台一样,传统分析会生成公司的关键指标——价格、市值、市盈率、每股收益等——以及一般总结图表和“情感分析”(搜索来自Reddit和Yahoo! Finance等网站的用户市场情绪)。传统分析只是为了帮助获取关于公司的基本信息,这些信息将被原则分析或AI顾问所扩展。对于Zoom,输出内容如下: 5、如何访问此工具 该网站可以通过访问,或者在浏览器中输入”finciples.ai”。目前该平台对所有人免费,并正在寻求投资者反馈以确定他们是否会持续使用该平台。我希望每个人都能尽快体验到该平台。 6、结束语 作为一个finciples.ai的长期用户,finciples.ai提供的独特价值是显而易见的:一个集中的、一站式的地方,我们利用AI的力量做出更好的投资决策。通过选择自己的原则来测试股票的定性和定量因素,finciples.ai使投资者能够以前所未有的效率和个人化方式优化他们的投资过程。我希望每个人都能体验到finciples.ai带来的改变生活的体验,并希望很快能在平台上见到大家!
2025-02-16 阅读全文 →