低成本,那是模式的创新!|邵晓鹏专栏第三季
引子
1、一个流行多年的笑话
上世纪八九十年代,中国中原大地有个省份盛行仿冒,小到茅台、五粮液,大到文物,无不涉猎。有一天,一个大学生毕业工作后,春节回村给老爹孝敬了一瓶价值几百元的茅台,老爹看了直接骂儿子:“你个不肖孙,弄啥哩?花恁钱买这玩意儿干啥呢?我们后院就有,要几瓶灌几瓶!”
这是小菜,还有更狠的,故事是这样的:一次在首都召开的国际展览会,展出了一款Y国的高级装备,这家伙,功能太强大了,指标极其领先。展览会老总看了之后,艳羡之意顿上心头,就想着怎么能把这宝贝玩意儿给解锁了,变成自己的技术。于是他想方设法让Y国人员多展一个星期,伺机攻关。Y国人员当然知道他们的意图,但鉴于技术自信,别说一两天,就是一个星期、一个月,甚至一年,他们也不可能仿制出来。于是,大方地给了老总一个机会,给你三天时间。老总召集相关部门的负责人和专家,让他们出谋划策,想办法仿制一台,狸猫换太子,替换那台真装备。可是,在会上,大家连连摇头,表示目前的水平,别说三天,就是三年也不可能完成任务。老总急坏了,大发雷霆。正在窘迫尴尬之际,有人给老总提议:您找那中原省份的牛人,他估计能给你解决问题。老总一脸疑惑,无奈只能求援牛人。哪知牛人说:哪里还用三天,一天就能搞定。老总更是心里没底,但也没办法,只能让他去试试。结果呢,一天过后,该牛人果真一脸骄傲地把仿制品给交了过去,那个逼真啊,就连真品哪个部件上的划痕都一模一样,完全可以以假乱真。老总高兴坏了,吩咐替换掉真品,提前让Y国人员取走。Y国人员也是大惑不解,一肚子的疑虑让他们更加谨慎。他们仔细检查这个仿制品,丝毫没有发现问题,于是心安。可是,第二天,Y国人员竟然上门声讨,口口声声直言老总给他们的是复制品,要求追回真品。老总问:“为啥说是仿制品?”Y国人员红着脸,不好意思地说:“肯定是复制品无疑!我们带回去后总感觉哪里不对劲,可是怎么检查也没查出问题,直到上电之后检测,才惊奇地发现——指标比原先那台还要高出不少!你们肯定做了手脚……”
故事没完,当老总问牛人是怎么做到时,牛人自豪地说:“哈哈哈,俺们省仿制创新这一块儿,不走寻常路,仿啥像啥,没有仿不出来的。这叫‘ 模式创新’!”
2、制造业大国的实力
一位制造业大佬说:“中国的工业发展到今天,加工能力太强了。几乎什么东西到了中国,我们都能把它做到非常便宜,让外国人无力招架。这么说吧,什么东西一旦被中国人看上了,很快就能做成白菜价。”
诚然,你看看华强北市场,仿创能力极强,国外大品牌新出的产品,很快就有了仿制品,价格极其诱人!尤其像表带之类的产品,仿制品就像东南某地的运动鞋一样,做得比国外大品牌质量还好!这就像一个蛇皮袋打上高档奢侈品牌Logo,它的价格就能升天,还真有人会买,那卖的是品牌,并不是品质。
可是,我们也有造不出来、造不好的,比比皆是卡脖子的高端仪器,尤其是光刻机的故事,几乎无人不晓。我们的制造能力如此之强,可为什么造不出来呢?这里当然有关键技术问题,难道没有模式创新的问题吗?
一、低成本的魔咒
低成本已然成为这几年流行的口号,为了生存,各行各业都在努力地降低成本。低劣的典型如某些航空公司,把餐食变得越来越简单,甚至取消,连水都不提供了。这种节省成本当然会为人所诟病,其直接结果就是客户流失。
在我的专栏里,我们关心的当然是光学成像领域如何做到低成本。
在传统成像模式下,降低成本就意味着品质降低。在不降低品质的前提下,如何降低成本,而且要断崖式地降低成本,该怎么去做呢?
在追求像质越来越高、像素越来越多的时代,再降低成本,只能依靠原材料批量采购压低成本,靠工业化的大规模制造,提高产品良率,以博得生存之地。目前的消费数码领域走的就是这样的路线,于是先进的生产线和高效的检测设备就成了维持这一模式的重要角色。当然,现在很多工业界也在走这样的路线,尤其是有一定量的产品,一般都会有好的结果。可是,你马上就能看到这里的价格天花板,仅仅依靠压低原材料成本和提高产品良率,降低成本的空间并不大,拦腰的价格都不太可能,除非更换了新的材料,更别提数量级的压缩成本。
图 光学镜头加工
而且,在更多时候,很难会有像消费品那样的产量需求,尤其是诸如航天、航空领域中,光学载荷的需求永远不会出现消费级产品的数量,但它们降低成本的压力很大。原材料不降价或者降价幅度很小,自动化产线自身的高昂费用很难摊到产品中,甚至在量达不到的情况下会提高成本。此时,我们该怎么做?于是,就有人打器件的主意,用工业级芯片筛选做宇航级、用商用芯片做工业级应用,当然,结果只能是杯水车薪,不可能有质的改变。
当站在悬崖边上走投无路时,求生的欲望只能另辟蹊径,于是,模式创新便呼之而出。
二、模式创新
模式创新的本质是降维打击。方便面被打败不是因为出现了更好的方便面,而是外卖;胶片被打败是因为CCD的出现,而不是出现了更好的胶片;甚至数码相机被打败,也不是因为有更好的数码相机,而是手机摄影的出现。最近,我们可以看到一个典型的案例是Tesla,FSD的12.3版本采用纯视觉方案,在AI的加持下竟然全面碾压了那些既有摄像头、还有昂贵的激光雷达配置的自动驾驶方案,这绝对算得上是典型的模式创新了。那么,在成像领域,模式的创新将会体现在哪些地方呢?其实,你从计算成像的定义中就能看到答案,那就是硬件的“软件化”,以“计算”换取整体性能的提升,也就是说:光电成像低成本的模式就是计算成像。
其实,软件取代部分硬件的案例有很多,我们经常会看到软件定义卫星、软件定义雷达等等这些名词,它们的做法就是利用软件强大的运算功能,替代原先只能用昂贵的硬件才能实现的功能,用软件代替,又根据软件可定制、可更新的特点,在条件成熟时可随意升级,获得性能的提升,又增加了产品的灵活性。另外一个案例就是Tesla的车主经常会收到Tesla官方推送的软件升级,在硬件系统不发生任何变化的情况下,通过软件更新提升性能,获得最优驾驶体验。
计算成像的典型特点就是“计算”,与软件定义某某其实是一样。当然,我们知道计算成像中的“计算”不单单仅是computation,还有一个重要的角色也在参与“计算”,只是它不是软件的计算,那就是“编码”。编码的任务主要是参与光场的调制,也就是说它是计算成像灵魂(即光场)的工程师。这其实在告诉我们,“编码”属于硬件,“计算”(computation)属于软件,软硬结合,相得益彰,才能达到降低成本的目的。只有“编码”和“计算”配合得好,才有可能实现降维打击,破解低成本的魔咒。
其实,讲到这里,你应该看得出:“编码”的核心还是计算成像的范式设计。那么,低成本的模式创新首先要做的事情是什么呢?答案是:挤掉光电成像中的“水份”。
三、成像中可挤掉的“水份”
光电成像到底有哪些“水份”呢?
用户需求决定成像的范式设计,而范式设计位居“水份”含量之榜首。这是因为用户需求决定着成像的品质诉求,对于什么样的成像品质是由具体的成像方式决定,这其实就是最重要的边界条件。同时,我们对于计算成像范式设计的收敛条件就是满足用户需求即可,不追求所谓的完美,也就是够用就行。当然,这个“够用”需要用户提出,我们来用结果证明其真的“够用”才行。就像开个照相馆拍个证件照一样,你非得购置上亿像素的中画幅相机,配上若干大光圈定焦的人像镜头,那就太不值得了!一般来讲,用户会给出一个体积、重量和价格的约束,然后是功能的描述,比如工作环境、探测距离、分辨率等。在传统成像难以达到设计要求时,计算成像就成了不二的选择,于是,范式设计就成了挤压“水份”的重头戏。
然后,我们还得再从光电成像的链路说起。传统的光电成像链路就是:光源-目标-介质-光学系统-探测器,显然,能参与到成本的只有光源、光学系统、探测器、电路,当然,如果是计算成像,还要有计算单元的价格纳入成本中。光源也只有主动成像时才会使用,在被动成像中没有这部分成本。那也就是说光电成像的成本主要还有光学系统(镜头)、探测器和电路,而光学系统的成本往往又占了大头,尤其是大口径光学系统,它的成本占比就更高了;如果再考虑加上自适应光学系统时,可以说,它将贵得让你用不起!成本占比高的部分当然就会认为是“含水量”大的、更有机会去挤掉“水份”的那些“显眼包”,拿它开刀一般不会出错。当然,在很多应用中,探测器的成本占比也很显著,解决探测器的低成本问题也很关键,尤其是以“感-存-算”一体、曲面、多物理量等为典型的计算探测器出现,将改变成像范式,引起的光学系统变化也都会带来成本的降低。
当然,不同成像类型的选择也是影响范式设计的重要因素。比如对于成像高分辨率的需求,是选择大口径呢还是选择合成孔径呢?这两种模式的设计理念和工艺要求完全不一样,对应的“水份”自然不同。当然,从目前的技术水平来看,这两种方法的成本都很难压缩,还有待新的计算成像范式来破解难题。
总结一下:光电成像可挤掉的“水份”最大的当属成像范式设计,然后有镜头(光学系统)和探测器等。
我们从中国光学期刊网上统计了一下计算成像的热门词汇,画一个成像相关的图,你就会看到方法千千万,“含水量”自然也各不相同。那么,该怎么挤呢?
四、降低成本的范式
光学成像系统的成本构成主要由原材料、器件、加工和装调几部分组成,结构越简单,用料越少,加工越容易,装调越简单,成本就越低。对于计算成像而言,压缩成本主要依靠以“软件”取代部分硬件,设计简单易加工装调的成像范式,以平衡性能与价钱的关系。可见,计算成像的范式设计才是决定成本的根本原因。

那么,说起计算成像的范式,就必须要从光场入手,因为计算成像的本质就是光场的获取与解译。成像时,光场如何从高维度映射到低维度,决定着采用什么样的成像架构,选择什么样的硬件,其加工和装调成本能否大幅度降低,加工周期可否缩短,能否通过算法优化达到成像目标,这些都是考虑的重点。我们在这里提到的是达到成像目标,而不是追求所谓的“完美”成像(当然,从来也不会有完美成像,只能无穷接近),其边界条件是满足应用需求即可。这就像我们去识别一个人,并不需要看清他(她)脸上的皱纹,更不需要看清衣服的款式等等,抓住重点才最重要。
于是,结构简单几乎就成了降低成本的首选,升维和降维就成了化繁为简的重要思想。比如,原先被动成像很难解决的问题,如果加上照明,增加了一个维度,看似简单,却可以解决大问题,很多复杂问题,往往都可以一“照”了之。
下面,我们通过几个具体的案例说明低成本的问题。
1、偏振成像
比如偏振成像依据偏振态获取方式不同,可分为:旋转偏振片成像系统、四孔径偏振成像系统和直接利用偏振探测器成像。旋转偏振片成像系统是将连续旋转的线偏振片置于探测器前,依次获得各线偏振方向的图像,最后计算得到偏振特征图像。这种方法虽然系统设计和数据分析方面都非常简单,但存在一些明显的缺点。大多数情况下,旋转元件已经是一个偏振器,因而只能检测线性偏振态。此外,场景和测试平台必须是静止的,以避免引入帧间运动。为了保证图像的质量,旋转速度要么太慢而无法实现更高的帧速率,要么偏光片需要跟着场景逐步移动来获取运动间的图像。
使用旋转偏振元件的偏振传感器
四孔径偏振成像系统通常采用四个单独的光学成像系统和独立的探测器,每个相机镜头上固定放置0°、45°、90°和135°偏振片,获取不同方向的Stokes矢量。四孔径偏振光学成像系统有独特的优势,其结构紧凑,实时性强,能够同时获取场景的全偏振态信息,适合对动态目标进行全Stoke矢量的偏振光学成像探测及应用研究。但其造价较高,是单一光学系统的四倍,光学元件多,装配难度大,且存在亚像素位移时较难配准。
四孔径偏振成像系统
偏振探测器将四个不同角度的偏振片分别放置于单个像元上,每个像素分别镀了0°、45°、90°和135°的偏振膜,每四个像元一组作为一个计算单元,只需要加一个光学镜头就可以直接工作。这种通过集成多个偏振角度的偏振片在单个传感器上的方式,使系统更加紧凑和稳定,但是这实际上是利用空间换空间的方法,牺牲了空间分辨率,同时还要有足够高的消光比,才能够有足够的能量进入到探测单元,保证信噪比。
偏振探测器示意图
2、光谱成像
传统高光谱成像系统多通过借助空间维或光谱维扫描器件,实现二维探测器采集三维数据立方体,但这种方式不可避免地造成了整机质量与体积大,且价格高昂,工作在可见光谱段的成像高光谱仪都动辄二三十万元,更别提光学材料更加昂贵的红外谱段了。而对于目标检测与识别来说,往往不需要冗余的高光谱信息,只需找到和分析几个典型光谱特征就可以实现了,就像基因比对一样。因此,可根据特定识别任务,寻找光场在光谱维度的最佳投影方案,获得有用的离散化多光谱片段,挤掉高光谱信息中的无用成分,从而开发出元器件少、结构简单、低成本的光谱相机。例如,多通道光谱滤波芯片与编码孔径型多光谱相机可根据应用场景定制化选取几个光谱探测通道来完成目标检测任务,前者可大批量、低成本制备,后者仅需在普通成像镜头中插入简单的编码孔径即可。
高光谱到多光谱
多通道光谱滤波芯片型相机与编码孔径型多光谱相机
3、极简光学系统设计
传统光学系统往往通过复杂结构、复杂面型以及特殊材料来提升成像质量,但不可避免地造成成像系统体积大、成本高加工难度大等问题。极简光学系统根据任务需求,打破传统光学设计以像差驱动的设计方式,将光学镜头成像与数值计算解译相结合,将成像系统“硬件”承担的功能分担一部分给“软件”,大幅降低成像系统对硬件的需求,实现极简光学成像。例如在空间相机上,传统设计方法对主镜面型精度要求达到λ/50,采用极简设计后,主镜精度下降到λ/10左右时,依然能够实现良好的成像效果,极大降低空间相机的生产成本和周期。
极简光学系统设计
4、计算照明
在表面缺陷检测中,当缺陷区域小且边界不明显时,人眼或相机很难直接识别,影响机器视觉的准确率。为了更高精度地检出缺陷,突出缺陷在相机图像上的对比度就显得尤为重要。照明就是解决表面缺陷检测的重要方式。针对不同的缺陷类型有针对性地选择环形光源、条形光源、漫反射光源等等,利用光源调制在成像系统中突出缺陷与周围区域的差异,实现表面缺陷的高精度检出。
表面缺陷检测
5、光学合成孔径
单体整镜式光学系统只能通过不断增大光学口径来提升光学分辨率,而这又会带来系统加工装配难、系统体积大、成本飙升等一系列问题。光学合成孔径通过将多个小镜子“团结”起来,实现频谱的延拓,也就是将图像的傅里叶频谱范围向外延拓,使得更多高频信息进入到成像系统,达到等效大口径的高分辨率成像效果,实现光学合成孔径成像。
6、曲面探测器
光学成像视场与分辨率相互制约,如果我们追求更广的成像视场,就难免牺牲系统的分辨率,然而一张宽视场的模糊图像并不是我们所需要的,就像捡了芝麻丢了西瓜一样,得不偿失。在保证大视场的同时提高系统的成像分辨率才是目前需要攻克的难题。采用共心球头镜的广域高分辨率成像系统是目前我们探索出的各视角光学一致性最佳的一种解决方案,在后端利用多个次级成像系统和相机对整个视场并行化的输出并拼接,能实现32亿像素的成像(第一代广域高分辨成像系统)。但,即便共心球头镜的光学结构避免了大多数视角不同带来的像差,次级成像系统的平面探测器结构还是会对次级成像光路的提出高要求,至少八至九片才能优化足够的像质。
能不能让这个问题简化一下?如果把探测器由平面改为曲面,那么光学上许多像差就无须仅依赖光学镜头优化了。最直观的,场曲就不需要额外的镜片消除了,这可能就是绝大多数的动物的眼睛中视网膜就不是平面而是曲面的原因,毕竟都是单镜片(晶状体)光学系统。实际上,仿生学一直是工程中的前沿,因为绝大多数的生物构造都是“SWaP”的,在有限条件下的高效能运行模式。对于广域成像来说,曲面探测器的同曲率的图像还更有助于算法的拼接合成,这意味着一定程度上算力的要求也被简化了。
半球曲面探测器
7、切片扫描仪
此外,在全视场切片扫描仪系统的设计过程中,通过引入实时自动对焦算法以及将传统的物镜调焦方法变成筒镜调焦方法后,可大幅降低对高精度电动位移平台的依赖,采用低成本的电动位移平台就可实现高速高精度的自动对焦以及高分辨率的成像结果,实现低成本的全视场切片扫描仪。
低成本全视场切片扫描仪
8、自适应光学
自适应光学系统目前被普遍用于天文观测中,解决由于大气扰动产生的像差所引起的图像降质问题。该系统主要包括两个核心部件:夏克-哈特曼波前传感器,用于高速测量成像系统中的光学像差;波前校正器,用于对所测量的光学像差进行同步校正。系统中各组件在控制器作用下协同工作,最终实现对光学像差的实时校正,提升成像质量。然而,恶劣大气环境下的光散射问题更加复杂(建模难度大、能量损耗高等),目前的自适应光学系统或者波前整形技术在面对上述问题时依然受限。利用时间门滤波的方式提取复杂信号中的弹道光分量是可能解决上述光散射问题方式之一,但是信噪比问题依然受到考验。
自适应光学系统实现装置
降低计算成本的最佳手段是算法的芯片化,其大规模应用不仅可以大幅降低成本和功耗,而且体积和质量也会大幅减小。
五 、SWaP的呼唤
SWaP(size,weight and power)一直呼唤着光电成像领域大胆革新,从需求紧迫的航天、航空领域,发展到地面装备,甚至到民用领域的手机、电脑、VR等设备,都一直喊着要SWaP。从苹果的Vision Pro那8颗摄像头你就能看出端倪,既贵又重。在SWaP方面,发展最好的当属探测器像元尺寸的缩小,即小像元探测器,典型如红外探测器由原先的25 μm发展到14 μm、12 μm,甚至8 μm,可见光探测器由3 μm左右发展到1 μm甚至0.7 μm,都会使空间分辨率不变的情况下减小光学系统,于是,我们在手机用上了多个摄像头,便携式的数码相机被打得一塌糊涂,几乎失去了市场,只有貌似高端的数码单反/微单/旁轴还苟存于世。现在,哪个旅游点还不是手机摄影的天下?哪个手机还在宣传通讯功能多好多牛?
革自己的命很难,也很疼,事实上,谁也不愿意。固有的模式惯性既拖累着厂商,也拖累着用户,因为厂商是既得利益者,他们不想放弃自己已投入的资本(包括技术工人和产线)而转向新的模式;而用户只抱怨东西太贵还不好用,关于怎么去改,他们当然更没有头绪,只能硬着头皮被迫接受现有厂商的产品。
于是,需要第一个站出来“吃螃蟹”的人,用实际行动告知天下:新的成像模式的SWaP能力很强,你用还是不用?此时,耳畔传来一串熟悉的声音:“从前,有一大盘“螃蟹”呈现在我的面前,我却没有珍惜,如果上天再给我一个机会的话,我会说:我吃!我吃!我还要吃!”