GeekAI-Plus怎么运营才不会亏本?
怎么运营才不会亏本?
本文讨论一个很多群友问的一个问题:我有一定的用户资源,想要部署一个来对外提供服务,请问我要把价格算力价格设置多少才合适呢? 或者换句话说,我要怎么设置价格才不会亏本呢?
我这里给大家提供一个简单的估算思路,供大家参考。不一定很准确,但是可以保证误差在可控范围内。
1. 算力成本
首 ...
大模型核心参数详解:从基础配置到高级调优指南
引言:参数调优的重要性
在大语言模型的应用中,仅仅提供一个好的提示词往往不足以获得理想的输出结果。模型参数的合理配置同样至关重要,它如同给模型调配合适的“工作性格”,直接影响生成文本的质量、风格和适用场景。本文将系统介绍大模型的各类关键参数,帮助你从被动使用者转变为精准调控专家。
一、模型基础结构参数 ...
Visual Studio Copilot 全面升级:更智能的默认模型、多模型切换、更便捷的使用管理
作为全球最受欢迎的集成开发环境之一,Visual Studio 一直致力于为开发者提供高效、智能的开发体验。无论是构建现代 Web 应用、跨平台移动应用,还是进行企业级系统开发,Visual Studio 都凭借其强大的调试工具、智能代码提示、丰富插件生态和云端协作能力,成为众多开发者首选的生产力平台。
近年来,随着 AI 助 ...
读AI繁荣01AI之屋
1. AI是驱动第四次工业革命的通用技术
1.1. AI不仅被用作科学家的实验工具,而且开始广泛渗透到日常生活中,重塑着我们的工作、教育、社交、健康乃至情感体验
1.2. 着眼于构建公平、透明且负责任的AI系统,确保技术进步惠及每一个人,尤其是那些在传统社会结构中常被忽视的群体
1.3. AI不再是遥不可及 ...
Windows平台下CUDA安装及llama.cpp使用教程
本文将详细讲解Windows平台下,如何安装与NVIDIA RTX显卡匹配的CUDA工具包,并正确配置、使用llama.cpp加载大模型,实现模型高效运行(将模型几乎全放入显卡,提升推理速度),全程结合实操截图与具体命令,新手可直接跟着操作。
1.首先需要下载与RTX对应的CUDA驱动,此处必须保证完全一致,执行nvidia-smi命令获取版本信息 ...
大模型基础(四):强化学习入门-从斯金纳箱到大模型推理
2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要?它如何从训练老鼠变成训练大模型?这篇文章带你一探究竟。
一、一个老鼠实验引发的革命
1.1 斯金纳箱:强化学习的源头
1930年代,心理学家斯金纳做了一个著名实验:
实验过程:
把一只老鼠放进箱子
箱子里有一个杠杆
老鼠偶 ...
Hy-MT1.5-1.8B-2bit:腾讯开源 574MB 能打败 72B 巨人的移动端翻译模型
Hy-MT1.5-1.8B-2bit:Tencent 开源 574MB 能打败 72B 巨人的移动端翻译模型
TL;DR
Hy-MT1.5-1.8B-2bit 是腾讯混元团队推出的突破性 2-bit 量化翻译模型,将 3.3GB FP16 模型压缩至仅 574MB,同时保持世界级翻译质量
基于腾讯自研的 SEQ(Stretched Elastic Quantization,弹性延伸量化) 技术,属 AngelSlim 压缩工具包的 ...
iNeuOS工业互联网操作系统集成大模型智库(iNeuOS_AiMind·心智灵慧)
1. 概述
iNeuOS工业互联网操作系统作为工业数字化底座,长期面向设备采集、数据处理、数据分析、报警监控、远程控制和业务应用集成等场景提供统一的平台能力。在工业现场,数据分散、经验分散、知识分散往往是企业推进智能化升级时遇到的第一道门槛。
随着模型智库模块“iNeuOS_AiMind·心智 ...
彻底解决大模型 JSON 报错:提示词 + 硬约束 + 兜底的全链路修复方案
众所周知,大模型的核心原理是『文字接龙』,通过概率计算输出下一个 Token,这种机制天然存在幻觉问题,导致模型会一本正经的胡说八道。
当要求大模型输出 JSON 格式时,也常因为幻觉问题遇到各种格式灾难:
附带冗余话术:比如前后夹带“好的,这是你要的结果”、“以下是符合要求的JSON”。
Markdown 标签包裹:带有 ...
LangChain框架-基础
1.LangChain是什么?
LangChain 是⼀个⽤于开发---> 由(⼤型语⾔模型(LLMs)驱动的应⽤程序)的框架。
简单来说理解就是一个用开发开发大模型应用的开发框架,内部集成了很多功能,也有很多第三方生态扩展,用起来事半功倍,就把他想象成C#中的.NET Core框架,go中的Gin。
它简化了大语言模型应用程序生命周期的各个阶 ...
方差在扩散模型保护中的作用
Variance in Adversarial Attack for Customized Diffusion Models
IDProtector:一种对抗性噪声编码器,用于防范保留身份的图像生成
Related Works
Tuning-based Customized Generation
DreamBooth, Custom Diffusion, LoRA and Textual Inversion
需要多图像微调,它们需要大量的计算资源和时间
Encoder-based ID-Preserv ...
Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平
Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平
TL;DR
Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型,采用稀疏 MoE 架构,35B 总参数但每 token 仅激活 3B
Apache 2.0 许可证,完全开源可商用
在 Terminal-Bench 2.0 得分 51.5(vs Gemma4-31B 的 42.9),SWE-bench Verified 得分 73.4 ...
做 AI 应用必懂:Function Call 和 Skills,到底差在哪?
前言
今天来详细讨论一下,function call 和 skills。function call 到底是什么,skills 到底是什么,它们分别解决什么问题,最本质的区别在哪,以及在 Agent 系统里该怎么配合
function call
function call 的本质,是让模型以工程化的方式调用某个具体工具或函数
以前模型想调用外部能力,通常只能口头表达——比如它输 ...
先免费试用下Claude code安装使用(教程)
🧑💻 写在开头
点赞 + 收藏 === 学会🤣🤣🤣
2026年了,如果还不会使用一款AI编程工具,未来将会越来越难行。 今天我们先来使用一个终端编程比较火的工具:Claude code
一、安装
1、nodejs安装
如果你本地没有node环境,是需要先安装node的,node版本至少要18.0以上,可点击下面地址跳转到nodejs官网下载下载Node.js ...
LlamaIndex高级RAG实战:从检索增强到知识图谱问答
一、RAG的局限与高级RAG
基础RAG(检索增强生成)存在明显短板:检索精度低、缺乏多跳推理、无法处理复杂查询。高级RAG通过查询改写、重排序、知识图谱增强等技术,将RAG从简单检索提升到深度问答。LlamaIndex是构建高级RAG系统的首选框架,提供丰富的索引结构和检索策略。
二、LlamaIndex核心架构
核心组件:
- Document/N ...
AI应用-提示词工程
1.什么是提示词和提示词工程?
提示词和提示词工程
提示词如何理解就是我们对大模型说的每一句话都是Prompt,例如咱们使用DeepSeek或者某包上面问一些问题,或者给出一些指令,而大模型跟你来回交互,其实就是在续写你给他的提示词(Prompt),当然也可以理解为用来引导模型输出特定的回答,或者做一些任务的一组词语。
提示 ...
DeepSeek-V3 + Spring Boot实战:10分钟接入国产大模型API
一、DeepSeek-V3 简介
DeepSeek-V3是深度求索推出的最新大语言模型,在代码生成和中文理解上表现优异。其API兼容OpenAI格式,开发者可零成本迁移。本文将手把手演示Spring Boot接入DeepSeek-V3 API。
二、获取API Key
1. 访问 platform.deepseek.com 注册账号
2. 进入API Keys页面,点击创建API Key
3. 复制Key(格式:sk-x ...
别再混着用了:agent 和 workflow 到底有什么区别?
前言
一个agent,一个workflow。很多朋友在群里一聊就是“我搞了个 agent”,结果仔细一看,其实只是配了个固定流程;也有老哥把本该交给 workflow 的事,硬塞给 agent,最后调了半天,成本起飞,效果还不稳定
所以这篇文章,笔者就把 agent 和 workflow 的区别掰开揉碎了讲清楚
基本概念
workflow 是什么
说白了,它像流水 ...
LLM微调实战:用LoRA让大模型更懂你的业务
一、为什么需要微调?
预训练大模型(如GPT、Llama、Qwen)具备强大的通用能力,但在垂直领域往往表现不佳。微调(Fine-tuning)通过在特定领域数据上继续训练,让模型"学会"你的业务知识、术语和风格。
二、LoRA为什么是最佳选择?
LoRA(Low-Rank Adaptation)的核心思想是:冻结预训练模型的原始权重,只训练两个低秩矩 ...
Context 工程:如何把正确的上下文喂给 AI
我们在项目中一定都遇到过,AI 明明很"聪明",工具也都接好了,结果你让它改个 bug,它改的完全不是你想要的文件;你让它写个组件,它生成了一套跟项目风格完全不搭的代码。
这不是 AI 笨,也不是工具不行,「而是你"喂"给它的上下文不对。」
你可以把 AI 想象成一个远程结对编程的同事——他水平很高,但「他只能看到你屏 ...