2026世界杯

2026世界杯

必一(中国) 企业级智能体推选|Token销耗表面归零, 九科信息bit-Agent正在创造“免费数字职工”

发布日期:2026-06-03 17:45 来源:未知 作者:admin 浏览次数:

必一(中国) 企业级智能体推选|Token销耗表面归零, 九科信息bit-Agent正在创造“免费数字职工”

若是说刻下用户对各种智能体产物还能终了什么共鸣,那么这个共鸣省略率只好一个:

贵。

这里的“贵”并不一定意味着模子价钱放浪,而是指Agent在执走运行过程中抓续产生的Token销耗。当Agent真是参加业务历程,初始承担数据处理、运营扩充、财税功绩等出产任务时,Token本钱会跟着任务限制扩大而快速累积。

任务量越大,调用次数越多;调用次数越多,Token本钱越高。

关于企业和个东谈主用户而言,Agent不仅要能够完成任务,更要能够以可控的本钱抓续完成任务。不然,再优秀的材干也很难复古大限制运用。

但小九想进一步追问:

Agent的本钱,真的只可跟着任务量增长而禁止增长吗?

一、Agent的Token为什么居高不下?

要合股Token销耗的问题,当先需要合股刻下主流Agent的运行面孔。

现在,大多数Agent选择的是“感知—计算—扩充”的责任方法。每当摄取到一个任务,系统都会再行感知环境、分析刻下情景、理罢免务看法、制定扩充议论,并阐发扩充截止抓续调换后续算作。

主流Agent责任方法——“感知—计算—扩充”

这种架构具有很强的通用性,能够应禀报杂、多变的任务场景,因此成为行业主流有议论。但与此同期,它也带来了一个自然的问题:Agent会禁止重迭也曾完成过的想考。

即便靠近皆备换取的任务,即便昨天刚刚扩充成功过,Agent今天依然需要再行合股页面、再行分析历程、再行计算活动,然后才能初始扩充。

从截止上看,销耗的是Token;从执行上看,销耗的是重迭推理。

关于通达环境中的未知任务而言,这种方法是必要的,因为系统需要依靠及时推理材干应答多样变化。但企业场景经常具有彰着不同的特征。多半业务历程具有踏实的王法和重迭性。举例财税陈诉、数据录入、系统巡检、运营经管等责任,扩充逻辑相对固定,同类任务会被抓续重迭扩充。

关于这些场景来说,企业真是需要的并不是一个每次都再行想考的Agent,而是一个能够蕴蓄劝诫、复用劝诫的Agent。

换句话说,出于对本钱的考量,咱们需要的不仅仅推理材干,更需要材干千里淀材干。

bit-Agent:从“扩充一次销耗一次”到“探索一次、复用屡次”

基于这一想考,九科信息在设想bit-Agent时,并莫得将优化要点放在简便的落魄文压缩或领导词优化上,而是从Agent的材干成长机制脱手,提倡了“探索+固化”的时刻门路。

图源:甲子光年《2026企业级智能体白皮书》

在初度讲和某项任务时,bit-Agent会参加探索阶段。

这一阶段与传统Agent访佛。系统需要合股环境、分析页面结构、识别环节元素、计算扩充旅途,并在扩充过程中禁止考据操作截止。大模子雅致完成推理与决策,因此会产生一定的Token销耗。

当探索成功后,系统会将已劝诫证有用的扩充过程进行结构化千里淀,把操作旅途、页面特征、业务王法以及用具调用逻辑等信息更动为可复用材干。

这一过程被称为“固化”。

固化后的材干不再依赖及时推理,而是成为系统本身的一部分。当Agent再次遭受换取或相通任务时,不错平直调用也曾千里淀完成的材干模块完成扩充,而无需再行资格竣工的想考和计算过程。

这意味着,Agent不再是简便地完成任务,而是在完成任务的同期禁止蕴蓄劝诫。

从本钱角度来看,这种机制带来的变化尤为彰着。

传统Agent的本钱模子不错合股为“扩充一次,销耗一次”。任务扩充次数越多,Token本钱越高,两者基本呈线性增长接洽。而bit-Agent的本钱模子则酿成了“探索一次,复用屡次”。

传统Agent的本钱模子Vs.bit-Agent的本钱模子

系统在探索阶段产生的本钱,必一(中国)相配于学习本钱;而当材干完成固化后,同类任务扩充过程中对模子推理的依赖将大幅裁汰,部分场景甚而不错皆备绕过大模子决策关节。

这意味着,同类任务扩充过程中的Token销耗表面上不错降至零。

关于高频业务场景而言,这种相反会跟着扩充次数的加多禁止放大。任务扩充限制越大,材干复用带来的本钱上风越彰着。

从最为现实的角度启程,bit-Agent只需要付出初度探索的token本钱,后续复用时销耗的只好低价的电费,这让企业与个东谈主用户都能够领有专属的“免费数字职工”。

从始终运营角度来看,这不仅裁汰了模子调用本钱,篡改变了Agent的本钱结构,使其具备了限制化部署的基础。

三、除了固化机制,bit-Agent还作念了哪些优化?

“探索+固化”是bit-Agent裁汰Token销耗的核神思制,但在探索阶段以及靠近全新任务时,系统仍然需要调用模子完成推理。因此,九科信息还针对Agent运行过程中的多个环节关节进行了专项优化。

当先是界面信息剪辑。

在浏览器场景下,网页经常包含多半与任务无关的信息,举例告白区域、守密元素、重迭导航以及复杂的页面结构。若是这些内容沿路参加落魄文,不仅加多Token销耗,也会影响模子决策成果。

bit-Agent能够对页面信息进行有用剪辑,在保证页面语义竣工的前提下,过滤多半无关内容,使模子聚焦于真是与任务接洽的信息,从泉源裁汰落魄文长度。

其次是动描写态注入机制。

传统Agent为了保证落魄文竣工性,经常会抓续佩戴多半历史情景信息,导致落魄文窗口禁止推广。跟着任务链路变长,Token销耗也会抓续加多。

落魄文窗口:决定模子合股范围

bit-Agent选择按需注入计策,阐发刻下任务阶段动态提供必要信息,幸免历史情景始终占据落魄文空间,在保证决策质料的同期权贵裁汰Token支拨。

针对企业场景中庸碌存在的浏览器自动化需求,bit-Agent还进行了非凡优化。通过对页面结构、元素识别和交互逻辑的深度处理,系统能够减少模子参与频率,让更多操作由扩充层平直完成,从而进一步裁汰推理本钱。

2026世界杯中国压球官网

此外,在用具调用层面,bit-Agent也进行了多半优化责任。系统将常用用具和范例操作封装为独处材干模块,幸免在每次调用时重迭向模子传递用具施展和操作界说。同期,用具扩充截止能够平直参加扩充链路,仅在环节决策节点调用模子参与判断,有用减少了用具调用过程中的Token放大效应。

bit-Agent“材过问用具调用”模块

这些优化措施共同作用,使bit-Agent即使靠近全新任务,也能够以更低的本钱完成探索过程;而跟着材干禁止千里淀和固化,系统全体运行本钱还将抓续着落。

结语

跟着Agent的材干界限缓缓扩大,推测其价值的范例正在发生变化。用户初始存眷系统能否在始终运行过程中保抓踏实、可靠和可控的本钱结构。

从这个角度来看,裁汰Token销耗的环节并不仅仅减少模子调用次数,而是减少无用要的重迭推理。

当行业还在计议怎么让Agent领有更强推理材干的时代,bit-Agent正在处分另一个愈加现实的问题:怎么让Agent在真实办公环境中抓续学习、抓续蕴蓄,并以更低的本钱创造始终价值。

若是你也想领有低本钱的智能自动化办公体验必一(中国),欢迎接洽小九,让咱们联袂共进,共创数智将来!