作者文章

fwq

FWQ
AI教程
基于CrewAI的合成数据生成
很多时候,在使用不同的 AI 代理框架时,我们对模型性能并不满意。通常,我们需要一个在特定领域或领域中工作的 AI 代理解决方案。模型本身也可能如此。 本文介绍了一个使用 CrewAI 代理生成合成数据的综合框架,以应对这些挑战。通过模拟基于代理的交互,CrewAI 使我们能够生成针对特定任务量身定制的真实数据集,从而显著提高机器学习模型的性能。本详细指南将引导你完成整个过程,从设置环境到生成和使用合成数据来微调模型。 开源模型(例如 Mistral、Llama 3、Phi-3 等)通过提供可以轻松针对特定任务进行微调的预训练模型,在 AI 民主化方面发挥了至关重要的作用。 然而,这些模型的性能高度依赖于训练数据的质量和相关性。在特定领域的数据集上对预训练模型进行微调已成为一种重要的技术,可使它们适应特定任务并提高其准确性(Radford 等人,2018 年)。传统的数据收集方法通常涉及手动标记和注释,这既耗时又昂贵,而且在场景多样性和覆盖范围方面也受到限制(Nikolenko,2019 年)。 如今,使用许多不同的框架(例如 Ollama、HuggingFace Transformers、crewAi 代理),可以将模型微调到你的特定领域或用例。 使用微调模型还有其他优势,例如推理成本。 1、概述 我提出的框架是通用的,可以轻松适应不同领域的不同用途。我将连同用于这样做的 Python 代码一起解释它。我将仅提供微调和…
2025-02-16 阅读全文 →
FWQ
AI教程
SmolAgents深入探索
SmolAgents 是 Hugging Face 的一个尖端库,允许开发人员创建能够解决复杂任务的智能、特定领域的代理。本博客将深入介绍 SmolAgents,包括工具、代码代理、安全代码执行和实际实现。我们还将结合代码示例使概念更清晰。 1、代理简介 在 AI 领域,代理是 LLM 输出控制工作流的程序。LLM 对系统操作的影响程度决定了其代理级别。这种代理存在于以下范围内: 无代理 ():LLM 输出不影响程序流程。 低代理 ():LLM 输出确定工作流中的条件分支。 中代理 ():LLM 输出决定执行哪些功能或工具。 高代理 ():LLM 输出控制迭代过程并可以启动其他代理工作流。 当任务需要基于动态输入进行调整的灵活工作流时,实施代理是有益的。但是,对于具有可预测和定义明确的流程的任务,传统的确定性编程可能就足够了。 !pip install…
2025-02-16 阅读全文 →
FWQ
AI教程
C++运行YOLO进行目标检测
本文是关于如何在CPU上运行YOLOv5模型,而不是GPU。要在GPU上运行模型,需要安装CUDA、CUDNN等,这可能会让人感到困惑且耗时。我将在未来写另一篇文章介绍如何在支持CUDA的情况下运行YOLO模型。 目前,你只需要安装OpenCV库。如果你还没有安装它,可以从这个安装。 那么,让我们开始吧。我会一步一步地讲解,完整的代码可以在页面底部查看。 1、导出YOLOv5模型为ONNX模型 创建一个新的文件夹并命名为你想要的名称。打开终端并将yolov5仓库克隆到该文件夹中。我们将使用此仓库导出模型为onnx格式。 git clone https://github.com/ultralytics/yolov5 我将使用yolov5s.pt模型,但你可以使用自定义的YOLOv5模型,过程不会改变。你可以从这个下载预训练模型,或者使用你自己的模型。如果你不知道如何训练自定义YOLO模型,不用担心,我已经有一篇文章介绍了这个内容,你可以查看它() 预训练YOLOv5模型 现在让我们将模型导出为onnx。有不同参数,你可以参考下面的图片。你可以编辑“”文件(yolov5/export.py),或者像我在这里一样手动更改参数。对于自定义模型,你需要将权重更改为你的自定义模型权重(your_model.pt文件)。 python yolov5/export.py --weights yolov5s.pt --img 640 --include onnx --opset 12 注意:你需要将opset设置为12,否则可能会报错。这是一个常见的问题,你可以在GitHub上查找此错误。 parameers/ export.py文件 2、创建TXT文件存储YOLO模型标签 这一步很简单,你只需要创建一个txt文件来存储标签。如果你使用的是预训练的YOLO模型,可以从此直接下载txt文件。如果你有一个自定义模型,则需要创建一个新的txt文件并在其中写入你的标签。你可以给这个文件命名任何你想要的名字,这并不重要。 coco-classes.txt 3、创建CMakeLists.txt文件…
2025-02-16 阅读全文 →
FWQ
AI教程
OpenAI Operator
在本文中,我将通过具有桌面和浏览器访问的 AI 代理的视角探索 OpenAI Operator,重点关注准确性、人工监督以及模型 (CUA) 和框架 (Operator) 之间的区别。最后,我将讨论未来需要牢记的关键挑战和重要注意事项。 最近发布了许多 AI 代理计算机接口 (ACI) 框架。 核心概念是 AI 代理驻留在用户的桌面上,使其能够通过 GUI 浏览 PC 和互联网。 将 GUI 视为 API 的人性化版本。此功能赋予 AI 代理无与伦比的自由,使其能够完全按照用户的设想执行任务。…
2025-02-16 阅读全文 →
FWQ
AI教程
5个文本/表格提取Python包
在当今的数字时代,从非结构化数据中提取有意义的信息对于各种应用至关重要。从 PDF 等文档中提取文本和表格在数据分析、信息检索和自动化任务中发挥着重要作用。 在这篇博文中,我们将深入研究 Python 中的文本和表格提取世界,探索可以简化这些过程的不同包。 0、光学字符识别 (OCR) 在深入研究提取包之前,让我们先了解一下光学字符识别 (OCR) 的基本概念。 OCR 是一种使计算机能够识别和提取图像或扫描文档中的文本的技术。它涉及一系列步骤,包括图像预处理、字符分割和字符识别。 文本检测和文本识别是两个基本组件,它们协同工作以在 OCR 中从图像或扫描文档中提取文本。让我们详细探讨每个部分: 文本检测涉及定位图像或文档中包含文本的区域或边界框。此步骤对于确定需要执行文本提取的关注区域至关重要。以下是文本检测过程的概述: 对象定位:应用对象定位算法来识别图像中可能包含文本的潜在区域。这些算法分析视觉特征,例如边缘、角和纹理图案,以确定可能包含文本的区域。 边界框生成:一旦识别出潜在的文本区域,就会在这些区域周围生成边界框。这些边界框定义了图像中文本的空间范围,并提供了一种隔离和提取文本以供进一步处理的方法。 一旦检测到文本区域,下一步就是执行文本识别,这涉及将检测到的文本区域转换为机器可读的文本。以下是文本识别过程的概述: 字符分割:在此步骤中,进一步分析文本区域以分割单个字符或文本行。这种分割对于将文本分成可以单独识别的较小单元是必要的。 特征提取:对于每个分割的字符或文本行,提取边缘、角或纹理图案等特征。这些特征有助于以有意义的方式表示文本单元的视觉特征。 字符识别:提取的特征用作字符识别算法的输入,例如机器学习模型或模式匹配技术。该算法将特征与预先训练的字符或字体集进行比较,并确定每个片段最可能的字符。 文本组合:一旦字符被单独识别,它们就会根据其在文本区域内的空间排列组合并组织成单词、句子或段落。此组合步骤可确保识别的字符按正确的顺序排列,以形成连贯且有意义的文本。 后处理:在文本识别步骤之后,可以应用其他后处理技术来细化识别的文本。这可以包括语言建模、拼写检查和上下文分析,以提高提取文本的准确性和连贯性。 文本提取包 1、Pytesseract Pytesseract…
2025-02-16 阅读全文 →
FWQ
AI教程
DeepSeek-R1本地运行成本
DeepSeek 将这场生成竞赛提升到了另一个水平,人们甚至准备在本地运行 671B 参数。但在本地运行如此庞大的模型可不是开玩笑;你需要在硬件方面取得一些重大进步,才能尝试推理。 这篇博客粗略地分析了在 PC 上运行 DeepSeek-R1 需要花费多少钱 1、硬件成本 大部分费用在于硬件。我们将讨论 GPU、CPU、RAM、SSD 存储、冷却系统等 GPU 4 个 NVIDIA H100 80GB GPU(每个 25,000 美元) 总成本:₹85,00,000(100,000 美元) 为什么?这些 GPU 是针对 AI…
2025-02-16 阅读全文 →
FWQ
AI教程
AI驱动的投资平台
两年前,我用Google Chrome和Charles Schwab登录账号开设了我的第一个投资账户。我对这一切一无所知——相信我,我的投资组合反映了这一点。随着我在股票选择和市场趋势中摸索,我的账户进一步陷入赤字。但当我更深入地进入投资世界时,我发现了一个改变游戏规则的东西:像Gemini和ChatGPT这样的AI工具。突然间,我可以比以往任何时候都更高效地进行深入的定性和定量研究。 看到这种方法早期的成功,我开始痴迷于完善我的策略。这段旅程最终将我带到了finciples.ai——一个拥有强大算法和数据驱动洞察力的AI驱动平台,它帮助我从一个挣扎的初学者转变为一个自信的投资者。让我来解释一下。 1、什么是Finciples.ai? 是一家使用大型语言模型(LLMs)评估公司基于定性和定量因素的小型初创企业。该平台提供三个主要功能:原则分析、AI顾问和传统分析。 2、原则分析(AI增强) Finciples.ai允许用户从传奇投资者中选择一组原则——比如本杰明·格雷厄姆和沃伦·巴菲特——或自己设定的一组原则。一旦你选择了自己的原则和想要分析的股票,你将获得一个总体评分以及基于每项原则与股票的契合度的单项评分。 例如,读了《聪明的投资者》之后,我爱上了本杰明·格雷厄姆。我也对Zoom进行了广泛的研究(查看我的文章),所以我希望利用AI来看看是否应该重新审视我之前所做的分析。当我将其输入网站时,它输出了这个分数: 这些分数为我作为投资者提供了很好的研究起点,了解公司的弱点和优势所在。但是,为了验证这一点,让我们用我选择投资的三大原则运行一下:公司有良好的管理系统、公司是行业领导者、公司具有折扣估值。当我用Open AI的Chat GPT运行这些原则时,我得到了一个完全不同的分数: 能够访问这些不同价值观和思维模式来选择投资,是finciples.ai真正的礼物,使我能够在任何时刻从不同的视角看待我的投资。这些分数也是我进一步研究的完美起点,更有效地筛选出具有真正潜力的股票,而不仅仅是使用简单的估值比率。 3、AI顾问(AI主导) 与原则分析中的AI增强不同,AI顾问只需要输入一个股票代码,AI就会给出它对该股票的看法。它会为你挑选所有原则并根据所选的LLM对股票的看法输出一个投资评分。这个工具非常适合快速了解股票的潜力,而不是专注于测试你最喜欢的原则。 对于Zoom来说,AI顾问输出的内容如下: 4、传统分析 和其他许多金融平台一样,传统分析会生成公司的关键指标——价格、市值、市盈率、每股收益等——以及一般总结图表和“情感分析”(搜索来自Reddit和Yahoo! Finance等网站的用户市场情绪)。传统分析只是为了帮助获取关于公司的基本信息,这些信息将被原则分析或AI顾问所扩展。对于Zoom,输出内容如下: 5、如何访问此工具 该网站可以通过访问,或者在浏览器中输入”finciples.ai”。目前该平台对所有人免费,并正在寻求投资者反馈以确定他们是否会持续使用该平台。我希望每个人都能尽快体验到该平台。 6、结束语 作为一个finciples.ai的长期用户,finciples.ai提供的独特价值是显而易见的:一个集中的、一站式的地方,我们利用AI的力量做出更好的投资决策。通过选择自己的原则来测试股票的定性和定量因素,finciples.ai使投资者能够以前所未有的效率和个人化方式优化他们的投资过程。我希望每个人都能体验到finciples.ai带来的改变生活的体验,并希望很快能在平台上见到大家!
2025-02-16 阅读全文 →
FWQ
AI教程
用Kokoro TTS制作AI配音
如果我告诉你,现在可以完全免费使用一种不仅好而且可能比 ElevenLabs 等行业领先(且昂贵)服务更好的工具来创建专业品质的 AI 配音,你会怎么想?听起来好得令人难以置信? 这就是 Kokoro TTS 的创建者每天都在证明的错误。这不仅仅是另一个文本转语音模型;这是一场 8200 万参数的开源革命,它颠覆了 AI 语音世界。我们谈论的是一个在极低预算下训练的模型,在日常计算机上运行,​​但在主要基准测试中却以某种方式超越了巨头。 好奇吗?你应该好奇。 这篇博文不仅会揭开 Kokoro TTS 背后的秘密,还会逐步指导你如何利用它的力量来创建令人惊叹的画外音,将你的项目提升到新的高度。 系好安全带,因为人工智能语音的未来就在这里,而且它是免费的。这不仅仅是一个教程;它是你进入一个正在重新定义景观的社区的大门。 1、Kokoro TTS 现象:AI竞技场上的大卫与歌利亚 我们都喜欢弱者的故事。而在人工智能语音的世界里,Kokoro TTS 是终极弱者。想象一下:一个只有 8200 万个参数的微型模型,仅用不到 100…
2025-02-16 阅读全文 →
FWQ
AI教程
Roo Code接入DeeoSeek R1
想象一下,你坐在办公桌前,对一款应用有一个构想,但无需费力地编写无数行代码,只需描述你的想法即可。 如今,借助 Deepseek R1 和 Roo Code 这两个工具,这一构想比以往任何时候都更接近现实。 Deepseek R1 是一款开源人工智能,可以解决从复杂的数学问题到复杂的编程挑战等所有问题,其推理水平可与业内最佳水平相媲美,同时还非常经济高效。 另一方面,Roo Code 可与 Visual Studio Code 无缝集成,成为你的个人编码伴侣,通过动态生成、调试和优化代码来简化你的工作流程。 1、Deepseek R1 Deepseek R1 是由创新型中国初创公司 DeepSeek 开发的先进 AI 模型。Deepseek 由梁文峰于…
2025-02-16 阅读全文 →
FWQ
AI教程
用AI简化用户画像分析
虽然AI有能力增强我们的工作,但它不能替代通过实际用户体验研究和分析获得的基本见解。 AI是一种帮助我们更高效地完成工作的工具;它不会取代我们。 在超过20年的用户体验研究经验中,我最初对将AI集成到我们的研究实践中持怀疑态度。然而,我发现像ChatGPT、Google Gemini、Microsoft CoPilot、Claude.ai等生成式AI(GenAI)工具非常有帮助。它们不仅能帮助分析数据以揭示洞察,还能在将这些洞察转化为有效的交付成果如用户体验角色和旅程图方面表现出色。 有许多方法可以编写AI提示来创建用户体验角色和旅程图。只需谷歌搜索“如何使用AI创建用户体验角色?”你就会找到很多资源(其中一些我已经使用并引用了)。那么,既然已经有这么多内容,为什么我还写这篇文章呢? 经过一年的研究和实验尝试了几种不同的方法后,我发现了一种成功的混合提示方法,这种方法具有独特的细微差别,似乎在任何我读过的文章中都没有涵盖。因此,我想分享我的发现,希望它们也能帮助其他用户体验研究人员。 1、用户角色 用户体验角色主要有两种类型:基于实际用户研究的角色和基于假设的角色。无论是创建基于数据的角色还是基于假设的角色(也称为“原型角色”、“临时角色”、“对齐角色”等),GenAI都可以提供极大的帮助。 ️ 关于原型角色的小贴士: 在我的经验中,产品团队以外的人往往不理解角色和原型角色之间的区别。因此,在创建原型角色时,我更喜欢使用“基于假设的角色”这一术语,这样就清楚地表明还需要进行研究。最糟糕的情况是,当你展示一个原型角色时,利益相关者认为他们已经完成了“角色”这一步,从而不再需要进行实际的用户研究! 如果你有兴趣了解更多关于如何创建原型角色的信息,我强烈建议你查看Tamara Aldin关于对齐角色的优秀作品。 即使角色是基于用户研究创建的,精简后的信息也是以一种虚构的方式呈现的,但仍准确描述了产品的平均用户。无论是名字、背景故事、标语等,这些虚构的元素有助于使角色变得生动,使其真实且令人难忘,同时增强其与受众产生共鸣的能力。我不知道你是否也有同感,但我总是难以撰写角色中的这些虚构部分,这也是我在GenAI中得到最多帮助的地方。 在进行了研究和分析之后,我知道我希望在角色中包含哪些数据以及如何对其进行分段,但我在最佳传达方式上遇到了困难。有些人可能认为这是角色创建过程中有趣的部分,但对我来说,我可能会花几个小时只是在构思合适的标语上打转。我是一个数据狂热者,热爱定性分析,但我不一定认为自己是最具创意的作家,这有时会让角色真正有意义。这不是说我不能独自完成,而是这需要花费我比那些有这种天赋的人更多的时间。AI来了! 最近,我一直在试验使用HeyMarvin、ChatGPT团队以及其他GenAI工具来帮助我在创建角色时填补通常会遇到的创意写作空白。为了以这种方式使用AI,我发现最好先自己完成大部分工作。 1.1 收集所有研究数据和洞察 收集所有访谈记录和/或研究报告,如果你进行了用户研究的话。如果你正在创建原型角色,你希望拥有很多可以分析的二手研究文件(品牌策略与行业报告、年终报告、以前的研究报告——调查结果、市场研究报告、客户服务报告等)或者某种文档,该文档捕捉了团队对目标受众的假设。 1.2 决定角色部分和行为提示 没有两个角色是一样的。选择适合你研究需求的角色部分至关重要。正如Steve Mulder在他的书《用户永远是对的》中提到的,角色的每一个元素都应该有目的,这意味着它应该帮助团队更好地理解和同情这个用户群体。始终确保背景与你的产品或服务的上下文相关。如果背景信息与用户如何使用产品或其功能无关,则没有必要包括过多的个人信息。 如果你想了解更多关于决定包含哪些信息的内容,请观看我的免费一小时课程,“如何创建和使用用户体验角色”。 1.3 将文档上传到GenAI工具(即你的数据集) 不同的工具允许上传不同格式的文件。目前,你可以在ChatGPT…
2025-02-16 阅读全文 →