发布日期:2024-11-18 13:26 点击次数:97
生成式AI是新的数字世界和用户世界之间的桥梁。拍照会是智能手机最容易告别“过度优化”,走向新一轮软硬件创新起点的开始?
vivo刚刚尝到冠军选手该有的味道。vivo X200系列眩光门这种极限概率的问题,被关注以及广泛讨论,都是当下智能手机末世和卷局的表现。动辄见观瞻,以及得咎于人,始终相伴。
手机大厂豢养的评测媒体和自媒体对手机功能的评测本身,不足以公平、客观地评价产品已经是众人皆知。北京大学某位教授所提到的语言腐败,是这个社会的每个人,每个行业,以及方方面面。
终有一日,大厂们要为此付出一定的代价。这一话题本身不足多论。
手机大厂们非常取巧地在共用一个“苹果设计师”。当小米去年最早开始全面借鉴苹果的直板复古外观,vivo也又借鉴了小米这种直板外观设计,X200系列沿用了这种风格。其他大厂又会继续借鉴vivo的外观?
库克、雷军、沈炜这些大厂的领袖,看来目标是一致的,就是投资效率。虽然,库克曾经口头对ROI这个词加之自己和苹果,表示过强烈的愤慨。GoogleVC的合伙人Siegler的评论十分确当,现在的iPhone就是Over-Optimized,过度优化。
AI影像的变化,会对手机软硬件创新带来机会
小米、vivo的新产品也都属于优化过度,未必有太多新意。优化了多年的屏幕之后,现在影像似乎正在成为这群企业领袖们着力优化的方向,苹果、三星、华为、小米以及此次意外事故瑕疵的vivo,都在发力这一领域。有了生成AI的技术潜力,Marc Levoy在谷歌Pixel开辟的计算影像路线,正在被几个大厂升级到一种“智能影像”的新高度。
vivo此前确定的赛道技术路线当中,影像是唯一表现突出的,该公司的影像负责人也已获得了重要的晋升。几个月前上市的谷歌Pixel 9系列,除了相机之外,几乎没有任何重大的提升和改善。
抛开个别公司和个别人事不论,相机会是未来一两年,手机大厂们唯一真实在做的努力方向?
AI影像的话题价值在于,作为智能手机最重要的功能,这个功能的AI化是否会影响到手机产品本身的进化?从所谓的智能手机,进化到智慧手机的第一个突破口,是否会与影像相关?
简单的逻辑,手机AI影像的升级并不会影响到智能手机大厂们卖广告,代理游戏运营的收入模式,不会影响到库克、雷军、沈炜们的ROI,可以积极投入,而不用担心会影响到“广告机模式”的短期收益。
生成式AI对手机硬件型态的变化和影响,甚至超过了此前通信制式的变化,端侧智能对本地存储、算力、数据传输技术的影响已经在发生。
典型的例子是,从4G手机到5G的升级,iPhone继续沿用了传统的石墨片散热方案,沿用了让人不齿的6G内存方案。现在,要想手机更好地运行一个本地化的ChatGPT架构,而不是访问一个APP,苹果也不得不升级iPhone的存储方案,并且对iPhone的硬件架构升级。
明年的iPhone 17系列,苹果将会跟随安卓生态的脚步,引入VC散热的方案。中国大陆的一家企业,以及中国台湾的两家企业会苹果供应相应的方案。此外,苹果正在考虑一些新的VC方案。
当优化、过度优化都难以解决问题的时候,革命就会发生。此前,Marc Levoy在谷歌所开创的人像模式、夜间模式、HDR+等玩法,后来苹果以及安卓生态发扬光大。2020年,此人在Pixel团队的内乱时离开了谷歌,加入Adobe,继续其计算影像之路。
Marc Levoy此后只有不多的几次对外发言。2020年,刚刚加入Adobe时,Marc Levoy接受了The Verge的访谈当中,他谈到了对计算影像技术方向的看法,不认同中国大厂们一味追求“大底”的技术路线。
他认为,未来的战场是加速器和背后的计算能力。
也是在这一年,他因为在计算影像方面的贡献而被授予美国工程院院士。在接受Adobe Life的访谈时,他提到了一个重要的趋势和方向,一些原来专业的影像的处理、编辑的平台,应用到手机上时,往往受制于硬件的性能。随着硬件平台技术能力的提升,计算影像的新天地在被开启。
这一表述,发生在多模态技术刚刚兴起,以及ChatGPT诞生之前。
两年之后,再接受CNET的访问时,Marc Levoy开始很明确地提到了Adobe和他本人正在努力的方向——在智能手机上,用一款通用的APP软件,为那些有一定能力的摄影者提供帮助,让那些原来需要手动控制的功能更为方便,比如,iPhone当中的Halide,以及安卓上的Open Camera。
如今来看,安卓和iPhone生态似乎应该积极拥抱Adobe的这种创意工具软件和生态。《智物》此前提到过,每一个智能硬件平台之上,会有一个全新的操作系统,用以支持用户数据和应用之间的智慧服务,其实,就像是ChatGPT大模型和模型之上的各种middle layer的关系,替代此前安卓、iOS的应用商店模式。
回顾Adobe公司和乔布斯以及Mac生态的恩怨,在AI时代的起点,Adobe这样的公司有几个重要的优势,天生对各种IT技术应用敏感,愿意尝试,更重要的是,创意人群天生具有付费的意愿和能力。在生成式AI大潮之下,Adobe的股价曾经一度被打压,跌势凶猛。
《智物》曾经跟多个投资机构交流过,Adobe反而是最容易拿到AI时代船票的公司。过去两年的进展来看,Adobe的进度似乎也验证了这个看法。
Adobe传统的软件平台Camera RAW目前适配支持多款手机,包括最新的iPhone 16以及三星旗舰版本,当然更是支持Marc Levoy老东家的Pixel系列,国内手机当中包括小米15系列,以及一加系列。
AI软件对手机影像的优化,可能会带来手机架构的本质变化
当智能手机可以完善地支持自身的AI影像,以及Adobe这种原本非常复杂的影像编辑、处理软件,会对其他的应用带来怎样的变化和影响?是不是会动摇到现有智能手机运算架构系统的基础?是否会动摇到如今,这些手机大佬们万分不舍的APP分发和流量广告的商业模式?
那个时候,或许应该有产品经理和创业者和投资人,不屑于再去构思“过度优化”的手机,而是去从新做一款手机。就像最近Marc Andreessen所提到的,不是再在一个成熟的蛋糕上撒面粉,而是重新设计,烘焙一个新的蛋糕。
李飞飞在其自传当中反复提到过《第一只眼》这本书,视觉能力在生物进化过程中所扮演的关键角色。手机这样的硬件设备,能够具备更强的影像拍摄能力,会对整个硬件系统本身带来如何的影响吗?
简单地描述这个问题。特斯拉的自动驾驶摄像头和系统,除了规划道路之外,也在识别整个周边的世界,既包括行人,也包括车主,这会让车辆的系统和架构非常不同于传统意义上的电动车。
从这个意义上来说,多模态和生成式AI技术是用户和数字世界之间新的桥梁,机器系统准确记录物理世界的能力,理解物理世界的能力,和生成一个虚幻的数字世界的能力,本来就是一种能力。
接近10年前,三星、华为都曾经试图用摄像头感知,让手机去识别、判断用户的简单行为意图,以今天的算法能力,和软硬件系统来看,会不会有新的成果?