香港大学/新加坡国立大学,Nature Nanotechnology!
米测MeLab

特别说明:本文由米测技术中心原创撰写,旨在分享相关科研知识。因学识有限,难免有所疏漏和错误,请读者批判性阅读,也恳请大方之家批评指正。
编辑丨风云
研究背景
人工智能和边缘设备的爆发式增长,凸显了传统冯·诺依曼架构中内存与处理单元之间数据传输缓慢的关键瓶颈。内容寻址存储器(CAM)作为一种早期形式的内存内计算,因其能够直接在内存中并行处理信息并实现高吞吐量的搜索,在网络路由和CPU缓存等高速搜索应用中具有重要价值和商业成功。
关键问题
目前,CAM的应用主要存在以下问题:
1、传统存储器密度受限和性能瓶颈
现有的CAM实现,例如基于静态随机存取存储器的CAM密度有限。而近期提出基于新兴非易失性存储器的模拟CAM,其性能和规模仍受限于硅晶体管的设计,导致搜索延迟、功率效率和阵列尺寸受限。
2、二维材料接触电阻导致的性能衰减
虽然原子级薄的2D材料有望取代硅并克服其内在限制,但基于这些二维材料的器件在实际应用中,性能通常受到高接触电阻的限制。这种高电阻源于金属诱导能隙态(MIGS)以及接触界面固有的vdW间隙,导致读出电流较小,进而影响内存内搜索操作的速度。
新思路
有鉴于此,香港大学Can Li、新加坡国立大学Lain-Jong Li等人介绍了一种利用原子级薄的二维MoS2闪存与半金属锑(Sb)接触的模拟内容寻址存储器。器件在二维闪存中实现了高读出电流(60 μA μm⁻¹)和高开关比(>10⁹)。这些突破使得在8×16模拟内容寻址存储器阵列(包含256个MoS2闪存器件)中,模拟内存内搜索操作的能耗极低(每个单元每次搜索低于0.1 fJ)且延迟极短(36 ps)。作者还成功展示了用于k近邻分类的模拟汉明距离计算,展示了其在机器学习应用中的高精度、高能效和低延迟潜力。这项研究突显了二维材料在克服当前硬件限制、实现智能边缘设备中更高效、可扩展的计算解决方案方面的变革潜力。
技术方案:
1、优化了半金属接触MoS2闪存的电学性能
研究人员在MoS₂闪存器件中引入半金属锑作为电极,降低接触电阻,提升电流开关比,使用低温ALD钝化提高介电层质量,增强器件稳定性与可靠性。
2、展示了MoS2闪存阵列的可靠性和均匀性
作者成功制备了8×16 MoS₂闪存阵列,器件漏电流小、电流高、多级存储稳定,阵列单元级控制精准。
3、演示了模拟CAM的范围搜索功能与性能表现
MoS₂模拟CAM阵列实现低能耗、低延迟搜索,能效提升了13.8倍,延迟缩短了568倍。
4、将模拟CAM用于KNN分类
作者将模拟CAM用于机器学习KNN分类,采用模拟汉明距离,结果表明精度高,还提出了双栅和3D堆叠结构,提升了性能。
技术优势:
1、半金属锑欧姆接触实现了高性能二维闪存
研究通过采用半金属Sb接触电极,有效地抑制了MoS2与电极界面处的MIGS,消除了肖特基势垒,实现了理想的欧姆接触。这使得MoS2闪存器件在二维闪存中实现了创纪录的性能指标,包括高读出电流和超高电流开关比。
2、模拟CAM阵列实现超低能耗和极短延迟的搜索操作
基于优化后的MoS2闪存器件,研究构建了8×16的模拟CAM阵列,成功进行了模拟内存内搜索操作。该阵列展现出极高的效率,将搜索延迟降至36 ps。此外,该系统成功应用于k近邻(KNN)分类的模拟汉明距离计算,相比于CPU计算加速了约10⁸倍,展示了其在高精度、高能效机器学习应用中的巨大优势。
技术细节
半金属接触MoS2闪存的电学性能优化
为了解决二维材料应用中的高接触电阻问题,研究人员在MoS2闪存器件中引入了半金属锑(Sb)作为接触电极。锑的近零态密度能够抑制MIGS效应,并结合强的范德华相互作用,形成欧姆接触,从而大幅度降低接触电阻(Rc范围为400 Ω μm至700Ω μm)。这种优化使得器件的饱和导通电流达到~230-300Ω μm-1,并具有超过的大电流开关比,为实现高速、高效率的模拟CAM奠定了器件基础。此外,通过使用作为氧前驱体进行低温ALD Al2O3钝化,有效减少了氧缺陷并提高了介电层质量,保证了器件在环境下的电学性能稳定性和长期可靠性。

图 内置2D闪存的Analog CAM
MoS2闪存阵列的可靠性和均匀性
研究成功制备了包含256个MoS2闪存器件的8×16模拟CAM阵列,并展示了阵列的可扩展性。该MoS2闪存器件通过增强二维材料通道的静电控制和优化的Sb接触,实现了极小的漏电流(<1pA)和高的输出电流。器件支持多级模拟非易失性存储,具有4V的宽存储窗口和在2,000秒内保持稳定的八个存储态。通过对53个不同沟道长度(LCH)器件的测量显示出良好的器件间均匀性,其中LCH为200 nm的器件平均读出电流超过50 μA mm最大值达到60 mA mm。在阵列层面,对96个器件的选择性编程实验成功展示了精确的单元级控制能力。

图 材料和器械表征

图 优化的MoS2闪存的电性能
模拟CAM的范围搜索功能与性能表现
模拟CAM通过比较输入数据与所有存储数据之间的可接受范围来执行一步式并行数据搜索。每个CAM单元由并联的MoS2闪存对组成,通过设置两个晶体管的阈值电压(Vth)来确定匹配的电压范围。当输入电压(VDL)落在这个定义的范围(Vth2< VDL < Vth1)内时,匹配线(ML)保持高电荷状态(匹配),否则快速放电(失配)。实验结果验证了这种范围搜索功能,并显示出高放电电流和低漏电流带来了更大的感知裕度。该MoS2模拟CAM阵列在搜索操作中表现出极低的能耗(低于0.1fJ/搜索/单元)和极短的延迟(36ps/1比特失配)。相比传统SRAM-TCAM,能效提高了13.8倍,延迟缩短了568倍。

图 二维模拟CAM阵列距离搜索功能和搜索操作的静态测量

图 2D模拟CAM的实验搜索操作和性能基准
内存内KNN分类与器件结构未来展望
研究将模拟CAM应用于机器学习中的k近邻(KNN)分类,采用模拟汉明距离作为相似性度量。模拟汉明距离允许在小范围内存在模拟失配,并通过模拟CAM的范用搜索功能高效实现。在四个经典数据集上的测试结果显示,使用模拟汉明距离的分类精度(例如葡萄酒数据集上的100%)与或优于其他距离指标。此外,为进一步提升性能,研究提出了双栅结构和3D堆叠互补闪存结构(采用n型MoS2和p型WSe2)。3D堆叠结构无需外部模拟逆变器,节省了50%以上的面积成本,缩短了互连延迟,为构建更高效、可扩展的集成系统提供了可行的途径。

图 用于机器学习应用程序的内存模式匹配和距离计算的AntoCAM
展望
本文利用半金属锑接触技术优化了二维MoS2闪存器件,实现了创纪录的读出电流和开关比,并成功构建了高性能的模拟内容寻址存储器(CAM)阵列。该阵列在内存内搜索操作中表现出超低能耗(<0.1fJ/cell/search)和极短延迟(36ps)。此外,该模拟CAM有效地加速了机器学习应用的模拟汉明距离计算,验证了二维材料在克服传统硬件瓶颈、实现高能效智能边缘计算方面的变革潜力。
参考文献:
Gao, G., Wen, B., Yang, N. et al. Sb-contacted MoS2 flash memory for analogue in-memory searches. Nat. Nanotechnol. (2025).
https://doi.org/10.1038/s41565-025-02089-7
版权声明:
本平台根据相关科技期刊文献、教材以及网站编译整理的内容,仅用于对相关科学作品的介绍、评论以及课堂教学或科学研究,不得作为商业用途。