AI教程 - 美云 - Page 112FWQ.AI — Fast · Worldwide

AI教程

本教程探讨了一个实用的示例，通过将强大的 Llama 2 语言模型与 smolagents 框架集成来构建 AI 代理。我们将分析一个代码片段（可在上找到），该片段作为问答任务的概念验证（POC）。这个练习为构建更强大和自主的 AI 系统提供了宝贵的见解。 1、加载和优化语言模型第一步涉及从 Hugging Face Transformers 加载 Llama 2 7B 聊天模型的量化版本。这里使用了 4 位量化。像 Llama 2 这样的大型语言模型具有数百万或数十亿个参数，需要大量的内存和处理能力。4 位量化是一种技术，可以在不显著牺牲性能的情况下减少这些模型的内存占用。…

2025-02-16 阅读全文 →

FWQ

AI教程

vLLM/ollama综合对比

欢迎来到我们深入研究 LLM 推理框架的最后一部分！在第一部分和第二部分中，我们分别探讨了 Ollama 和 vLLM，了解了它们的架构、功能和基本性能特征。现在到了决定性的一轮：面对面的比较，以帮助您根据特定需求选择合适的框架。这次比较并不是要宣布绝对的赢家——而是要了解哪种框架在不同场景中表现出色。我们将重点关注：资源利用率和效率部署和维护的简易性具体用例和建议安全和生产准备文档让我们深入研究数据，看看我们的测试揭示了什么！只有一个可以成为冠军，或者可能不是？ 🤔 1、基准测试设置为了确保公平比较，我们将对两个框架使用相同的硬件和模型：硬件配置： GPU：NVIDIA RTX 4060 16GB Ti RAM：64GB RAM CPU：AMD Ryzen 7…

2025-02-16 阅读全文 →

FWQ

AI教程

DeepSeek-R1的3个关键思想

来自中国的新型大型语言模型 DeepSeek R1 的发布在 AI 研究界引起了轰动。这不仅仅是又一次渐进式改进。DeepSeek 代表着一次重大飞跃。大多数新的 AI 模型感觉都像是小步。DeepSeek R1 则不同。这是近期第一个让你停下来思考的模型，这可能很重要。中国的一个团队上周日发布了它，它已经引起了轰动。它的基准接近 OpenAI 的 01 模型在推理任务（数学、编码和科学）中的基准。但有趣的不仅仅是数字。而是他们如何达到这一水平。 DeepSeek R1 背后有三个关键思想：思维链 — 让模型自我解释。强化学习 — 让它自我训练。蒸馏 — 在不损失能力的情况下缩小模型。…

2025-02-16 阅读全文 →

FWQ

AI教程

ComfyUI：从入门到精通

对于这篇文章，我想开始挑战，让初学者更容易在开源空间内进行高级图像生成。我意识到在 20 分钟内完成这项任务相当繁重。我们将介绍该领域的最新动态、哪些开源模型和工具很受欢迎、了解扩散的工作原理，并深入研究 LoRA、ControlNets 和 IP 适配器等关键技术。我们还将探索不同的用例以及如何将各种技术应用于每种用例。最后，我们将使用 Flux 创建一个室内设计师，该设计师会拍摄卧室的图像并生成不同的设计。你可以在下面看到它的样子。 ComfyUI 中的室内设计师工作流程如果你热衷于快速上手，可以跳过介绍直接进入构建。 1、简介这部分适合所有人，即使你不想深入研究使用自定义图像生成的技术细节。我们将介绍图像生成、发布的开源和专有模型、可用的技术、一些用例和构建成本。我在我的常用存储库中收集了一系列资源和信息，你稍后可以在找到。 1.1 图像生成式AI 如果你完全了解生成图像，应该进行一些研究。过去几年，这个领域出现了一些重大创新。但这不仅仅是你现在可以用提示生成高质量的图像，而且还涉及新技术如何让你精确控制这些图像中的品牌、产品美学和个性化风格等方面。开源社区在过去几年中一直非常忙碌。我们将介绍不同的用例以及这项技术是如何变化的。 1.2 封闭与开源模型我们应该首先了解的是这个领域可用的…

2025-02-16 阅读全文 →

FWQ

AI教程

复现DeepSeek-R1的顿悟时刻

Deepseek R1 的发布震惊了整个行业。为什么？因为 DeepSeek-R1 是一个开放模型，在复杂的推理任务中可以与 OpenAI 的 o1 相媲美，它使用群组相对策略优化 (GRPO) 和以强化学习为中心的多阶段训练方法引入。他们不仅发布了该模型，还发表了一篇关于他们如何做到这一点的研究论文。在中，他们描述了使用纯强化学习训练模型时的“顿悟时刻”。在此阶段，DeepSeek-R1-Zero（DeepSeek-R1 的第一次测试）通过重新评估其初始方法，学会为问题分配更多的思考时间，而无需任何人工反馈或描述如何执行的数据。他们将此描述为“顿悟时刻”：这种行为不仅证明了模型不断增强的推理能力，而且是一个引人入胜的例子，展示了强化学习如何导致意想不到的复杂结果。在这篇博文中，我们想使用群组相对策略优化 (GRPO) 和倒计时游戏重现 DeepSeek-R1 的小“顿悟时刻”。我们将使用强化学习训练一个开放模型，尝试教会它自我验证和搜索能力，以解决倒计时游戏。倒计时游戏是一个数字拼图游戏，玩家使用一组随机抽取的数字和基本算术运算（+、-、×、÷）来达到或尽可能接近目标数字。 Target Number: 952 Available Numbers: 25, 50, 75, 100,…

2025-02-16 阅读全文 →

FWQ

AI教程

10个职场必备AI头像生成器

过去几年，人工智能的崛起令人着迷。在如此短的时间内，人工智能肖像从令人费解的怪物变成了对真实人物的逼真描绘，你必须仔细检查才能发现任何问题。随着这一趋势的持续，不久之后，人工智能就会消除少数剩余的迹象，表明你在头像中看到的面孔不是真实照片。人工智能正在以我们几年前从未想象过的方式提供帮助；在职业世界中，它被用来帮助年轻人在职业目标上取得领先，并帮助经验丰富的老手提升他们的职业生涯，让每个人都能获得漂亮的头像，而无需花费时间和金钱聘请有才华的摄影师。一张漂亮的头像会对一个人的职业发展产生巨大影响。以下是对10个最佳人工智能头像生成器的评论。作为参考，还包括用于训练每个人工智能头像生成器的图像。 1、Portrait Pal 提供了良好的开端，可以快速轻松地为用户提供出色的结果。与其他生成器不同，生成的每张图像看起来都很逼真，几乎完全相似，背景清晰细致，质量很高。即使经过彻底分析，也很难看出这些图像是 AI 生成的。头像的风格也多种多样，从专业的西装领带到更休闲的风格，可用于各种用途。Portrait Pal 生成的微笑很友好，但不会表现出太多的兴奋。颜色很微妙，给人一种专业的感觉。这些图像可用于专业网页、LinkedIn 或社交媒体。作为一项服务，Portrait Pal 是目前最受欢迎的 AI 头像生成器之一。开始时，你可以在三个定价层级之间进行选择，每个定价层级都有自己的合理成本。除了处理速度更快之外，每个更高的等级都为您提供更多照片和更多背景、服装和选项。然后，借助稳定的扩散 AI 模型、一些微调以及你提供的照片（种类越多越好），只需几个小时（如果你支付最高等级，则只需 30 分钟），就会收到各种头像，完全满足你的需求。虽然列表中的其他选择也提供了一些很棒的选择，但 Portrait Pal 提供了高质量的照片，以及快速简单的上传图像和选择所需等级的过程。 2、PixelPose 下一个…

2025-02-16 阅读全文 →

FWQ

AI教程

8个向量搜索的常见错误

向量搜索在纸上看起来很简单——将一些嵌入放入数据库，查询它们，然后就得到了结果。但一旦你从爱好项目跃升到实际应用，你会发现“魔法”变成了一个充满爆炸性云账单、奇怪幻觉和完全错失目标的雷区。我见过团队在“优化”的管道上花费数周时间，最终却被同样的问题埋伏：延迟飙升、不相关的片段和成本高得无法证明其合理性。以下是我反复看到的八个陷阱——特别是那些没有计划就扩展向量搜索的团队。我还将给你实用策略来避开这些陷阱，这样你就可以节省时间、金钱和大量的压力。 1、一开始就忽略评估为什么这是个问题你设置了一个花哨的嵌入搜索，但很快发现有些查询失败了，而另一些则成功了——而且你不知道原因。这正是当你跳入向量搜索时没有一个适当的评估框架所发生的情况。你无法修复你无法测量的东西。应该怎么做创建一个小而可靠的评估集：即使只有50-100个带标签的查询也足以揭示巨大的差距。使用标准指标：NDCG、MRR、召回率——随便什么。先从某样东西开始，然后逐步完善它。监控改进情况：每次调整分块或切换嵌入时，再次运行评估。许多团队对高级分块技术或“上下文检索”，甚至知识图谱等感到兴奋，但对这些更改是否真的有帮助一无所知。评估可以让你摆脱猜测。 2、忽略混合搜索为什么这是个问题仅依赖嵌入相似性可能会错过明显的关键词匹配。如果你的嵌入未针对特定领域进行调优——或者用户查询的是罕见术语——系统可能会失败。与此同时，标准的关键词搜索（如BM25）本可以捕捉到这些内容。应该怎么做结合嵌入和关键词搜索：混合搜索将基于向量和基于关键词的结果合并。提高召回率：这种方法在许多向量数据库中很容易实现（例如，可以在同一张表中存储 BM25 和向量索引）。重新排序组合结果：返回两种方法的顶级结果，并让重排序器决定最终结果。越来越多的团队只使用嵌入，却想知道为什么简单的查询被忽略了。未经微调的嵌入通常在非标准数据集上的表现比简单的 BM25 关键词搜索更差。这就是混合搜索发挥作用的地方——通过结合嵌入和关键词搜索，你可以大幅提高召回率而不牺牲延迟。这是改进向量搜索管道的第一步。下面是一个混合搜索实际应用的例子：混合搜索示意图 3、过度优化（尤其是在没有评估的情况下）为什么这是个问题在建立明确基准之前，很容易被某些炫目的新检索技术吸引。如果你无法衡量影响，你就不会知道它是否有效。…

2025-02-16 阅读全文 →

FWQ

AI教程

9个开源合成数据生成器

在当今数据驱动的世界中，每个人都需要数据，但有时你可能没有太多数据可用。这就是合成数据发挥作用的地方！那么，它是什么，你如何生成合成数据？有了这些数据集，对隐私、合规性和其他问题的担忧就可以轻松缓解。因此，让我们来看看一些可能通过生成合成数据来推动报告和自动化未来的工具。 1、CTGAN 使用对抗网络的条件表生成（简称）是一种突破性的工具，它利用生成对抗网络的强大功能来生成高度逼真且连贯的合成表格数据。与传统的数据生成方法不同，CTGAN 擅长处理以特征之间错综复杂的关系和依赖关系为特征的复杂数据集。 CTGAN 的核心是一个精心设计的架构，由两个神经网络组成：生成器和鉴别器。使用条件对抗损失函数进行训练的生成器网络学习创建与真实数据集非常相似的合成数据样本。另一方面，鉴别器网络旨在区分真实样本和合成样本，在训练过程中为生成器网络提供有价值的反馈。 CTGAN 的主要优势之一是它能够捕获复杂的数据分布。通过利用对抗训练程序，CTGAN 学习生成合成数据，以保留真实数据集的底层统计属性，包括相关性、边际分布和高阶交互。 CTGAN 具有广泛的潜在应用，包括数据增强、缺失数据填补和隐私保护数据发布。在数据增强中，CTGAN 可用于生成额外的数据样本，以增强在有限数据集上训练的机器学习模型的性能。 2、DoppelGANger 使用 GAN 为时间序列应用程序创建合成数据。它对于在金融和物联网等领域生成数据特别有用。它巧妙地捕捉了现实世界数据中发现的复杂模式和依赖关系，使其成为各种时间序列应用程序的宝贵工具。 DoppelGANger 的主要优势之一在于它能够解决标记数据稀缺的问题，这通常会阻碍准确的机器学习模型的开发。通过生成真实而多样的合成数据，DoppelGANger 使研究人员和从业者能够更有效地训练和评估模型，即使在数据稀缺的情况下也是如此。通过利用 GAN 的功能，DoppelGANger 提供了一种强大的解决方案，用于生成高质量的合成时间序列数据。它的多功能性、开源性质以及解决数据稀缺性的能力使其成为从金融到物联网等广泛应用的宝贵资产。 3、Synner 的主要重点是为企业、研究人员和个人提供全面的解决方案，使他们能够高效、轻松地生成大量高质量的合成数据。 Synner…

2025-02-16 阅读全文 →

FWQ

AI教程

5个最流行的AI自拍生成工具

本文介绍5个最佳 AI 自拍生成器，这些工具可以创建与你一模一样的自拍照。我已经测试了此列表上的每个工具，以节省你的时间和金钱。 1、InstaHeadshots 是一款新的 AI 自拍生成器，可以拍摄你的自拍照并将其转换为不同环境中的逼真自拍照。只需上传你的图像并等待 30 分钟即可看到你的自拍照。优点：速度快。大多数 AI 自拍照生成器需要数小时才能渲染完成。这个工具只需 20-30 分钟即可完成。逼真。AI 图像看起来与我毫无二致。如果我将这些照片发送给我的朋友和家人，他们看不出那不是我。变化。不只有一张自拍照——在不同环境、衣服和灯光下有更多图像。编辑。该工具允许您对图像进行 AI 编辑，以对其进行最后的润色。缺点：价格昂贵。此工具没有免费试用。平滑度。一些图像太平滑，似乎应用了重滤镜，这“暴露了”这些是 AI 图像。提示：如果你想看到更少的自拍照，请在您上传到服务的图像中包含更少的自拍照。…

2025-02-16 阅读全文 →

FWQ

AI教程

ComfyUI-PromptOptimizer

是 ComfyUI 的一个自定义节点，旨在优化文本转图像模型的提示。它将用户输入的提示转换为更详细、更多样化、更生动的描述，使其更适合生成高质量的图像。无需本地模型。 1、功能提示优化：优化用户输入的提示以生成更适合文本转图像模型的版本。多语言支持：自动将非英语提示翻译成英语。丰富的细节：添加设置、颜色、灯光和整体氛围等细节。风格扩展：如果提示中包含视觉风格或艺术家参考，则扩展这些参考。多样化的输出：避免重复的词汇和短语，以确保提示独特而多样。轻松集成：作为自定义节点无缝集成到您的 ComfyUI 工作流程中。 2、安装将此存储库克隆到 ComfyUI 安装的 custom_nodes 目录中： git clone https://github.com/ciga2011/ComfyUI-PromptOptimizer.git 启动 ComfyUI 并确保节点列表中有 Free Prompt Optimizer 节点。…

2025-02-16 阅读全文 →