ChatGPT任务模式正式上线,标志着人工智能交互体验的又一次飞跃。这一模式通过更精准的任务导向和智能体协作,显著提升了用户与AI的互动效率。用户可以通过自然语言指令,快速完成复杂任务,如数据分析、内容生成、代码编写等。智能体的爆发式增长,不仅体现在响应速度和准确性上,还在于其多模态能力的融合,能够处理文本、图像、音频等多种数据类型。ChatGPT任务模式的上线,预示着AI在日常工作和生活中的应用将更加广泛和深入,智能体的潜力正在被充分释放。
过去一年,AI技术席卷全球,其中最受关注的莫过于“智能体(AI Agent)”这一概念,从国内的百度、字节跳动(豆包)、阿里巴巴,到海外的Anthropic和Google,各大科技巨头都在积极推进智能体的落地应用,而OpenAI也未能置身事外,自2023年11月起,便有消息称OpenAI计划在2024年1月推出“智能体”功能,这一消息得到了进一步证实——OpenAI在ChatGPT中悄然上线了“任务(Tasks)”功能,标志着其向智能体领域迈出了重要一步。
ChatGPT“任务模式”:从被动到主动的转变
在最新的macOS、iOS和Android版本中,OpenAI新增了GPT-4o Tasks模型,这一模式下,ChatGPT虽然取消了图片和文档支持,但保留了始终联网的能力,并新增了“执行计划任务”的功能,表面上看,这一功能似乎只是增加了定时提醒和回答问题的能力,例如每天提醒用户锻炼或每周发送新闻简报,其本质意义在于,ChatGPT正从一个被动的聊天机器人,逐步转变为能够主动执行任务的数字助手。
OpenAI官方表示,“任务模式”是ChatGPT成为更有用AI伙伴的重要一步,这一功能的核心在于智能体所具备的独立规划和执行任务的自动化能力,尽管目前仍处于测试阶段,但其潜力已初现端倪。
实际应用:从新闻简报到定制化任务
以实际应用为例,ChatGPT的“任务模式”可以用于生成每日新闻简报,用户可以设定每天固定时间接收小米相关新闻的汇总,测试结果显示,ChatGPT能够按时完成任务,并生成一份包含当日重点新闻的列表,也存在一些问题,例如部分新闻内容过时或与主题无关,这表明,ChatGPT在中文信息检索和国内生态理解方面仍有提升空间。
尽管如此,用户可以通过对话调整任务执行时间,甚至定制更复杂的任务,例如在新闻列表中加入一句话的重点分析或评价,相比之下,字节跳动的“豆包”虽然在新闻索引的丰富性和准确性上表现更佳,但缺乏自动化执行能力,仍需用户手动触发。
任务模式的局限与未来展望
尽管“任务模式”为ChatGPT带来了新的使用场景,但其功能仍存在明显局限,ChatGPT目前无法将复杂计划(如旅行或减肥计划)拆分为多个子任务,且每个用户最多只能开启10个任务,任务管理页面仅在网页端可用,且在实际测试中频繁出现加载失败的情况。
更重要的是,ChatGPT的“任务模式”仍停留在内容生成的层面,无法像Claude或荣耀YOYO那样直接操控设备或执行复杂操作,这一局限或许要等到OpenAI推出首个真正意义上的智能体——Operator(操作员)后才能得到解决。
智能体浪潮:2024年的AI新战场
2023年10月,OpenAI CEO Sam Altman在开发者日上宣布,2024年将是智能体的元年,这一预测得到了业界广泛认同,目前许多厂商宣传的“智能体”实际上只是定制了上下文或内置了角色设定文本,并未真正实现自动化操作,真正的智能体应具备独立执行任务的能力,例如Claude的“Computer Use”功能或荣耀YOYO的一句话自动执行任务。
要实现这一目标,模型层面的进化至关重要,无论是专业化能力的提升、经济高效的推理,还是可控性的增强,都是智能体发展必须克服的挑战,2023年12月,Google发布的Gemini 2.0被视为其进军智能体领域的重要一步,而其他大模型厂商也纷纷跟进,可以预见,2024年将成为智能体技术竞争的关键一年。
ChatGPT“任务模式”的上线,标志着AI技术正从简单的对话生成向更复杂的自动化任务执行迈进,尽管目前功能尚不完善,但其潜力已初露端倪,随着智能体技术的进一步发展,AI将不再局限于“聊天”和“对话”,而是真正融入我们的日常生活,帮助我们跳过繁琐的操作步骤,满足更复杂的需求,AI的下一站,或许正是从“站着说话”到“动手操作”的全面进化。
网友评论