什么是CAS号?

CAS号,全称CAS Registry Number,即美国化学文摘社(Chemical Abstracts Service, 简称CAS)注册号。它是一组分配给各种化学物质的唯一数字标识符。想象一下,它是化学物质的“身份证号码”。每一个被CAS数据库收录的化学物质,无论它是天然存在的还是人工合成的,纯净物还是特定组成的混合物,都可能被分配一个独一无二的CAS号。


这个号码的目的是为了在海量的化学物质信息中,提供一个稳定、一致且国际通用的识别方式,避免因命名不同(同一种物质可能有很多不同的化学名称、俗名、品牌名)、语言差异、命名规则复杂或结构描述不清而导致的混乱。

CAS号长什么样?

CAS号的格式是特定的,通常由三部分数字组成,通过短划线(-)分隔,例如:50-00-0 (甲醛formaldehyde)。

  • 第一部分:包含2到7位数字。
  • 第二部分:包含2位数字。
  • 第三部分:只包含1位数字,这是所谓的“检验位”或“校验码”。

数字位数是逐渐增加的,新的CAS号会分配更大的数字。校验码的存在是为了帮助验证号码的有效性,减少输入错误的可能性。

为什么化学物质需要CAS号?

化学物质的命名是一个极其复杂的问题。同一种物质可能:

  • 有多个系统命名(例如IUPAC命名、习惯命名)。
  • 有大量的俗名或商品名。
  • 在不同语言中有不同的名称。
  • 结构复杂,命名冗长容易出错。

例如,我们常说的“阿司匹林”,它的系统命名是“2-乙酰氧基苯甲酸”。在不同国家、不同时期可能有各种不同的商品名。如果没有一个统一的标识符,在查找资料、进行贸易、制定法规时,很容易因为名称不同而误认为是不同的物质,或者无法准确地找到同一种物质的所有相关信息。


CAS号的出现正是为了解决这个痛点。它不依赖于物质的命名、结构描述或任何其他属性,只作为一种纯粹的、与属性无关的唯一代码。通过CAS号,使用者可以快速、准确地检索到关于该物质的所有已知信息,包括其化学名称、分子式、结构图、物理化学性质、毒理学数据、安全信息、法规状态等等。

哪些物质可以获得CAS号?所有物质都有吗?

CAS号主要分配给那些结构明确或组成成分清晰的化学实体。这包括:

  • 纯净的有机化合物和无机化合物: 这是最常见的。
  • 聚合物: 通常根据其单体组成和聚合方式来注册。
  • 蛋白质和核酸: 基于其氨基酸或核苷酸序列。
  • 特定组成的混合物: 如果混合物的成分和比例是固定的或有明确定义的,有时会给该混合物分配一个CAS号。
  • 合金: 特定比例的合金也可能获得CAS号。


然而,并不是“所有”已知的物质都有CAS号。以下情况可能没有独立的CAS号或使用其他方式识别:

  • 结构不明确的复杂天然产物混合物: 例如,植物提取物,除非其活性成分被分离并鉴定。
  • 组成不固定的混合物: 例如,石油的不同馏分可能用沸程范围描述,而不是单一CAS号。
  • 理论上存在但尚未合成或分离的物质。
  • 非常规的实体: 例如,亚原子粒子、宏观物体等。

因此,CAS号虽然覆盖了绝大多数化学相关领域,但它是一个动态增长的、针对特定类型化学实体的注册系统,并非宇宙中所有物质的百科全书。

CAS号在哪里可以找到?

查找一个已知物质的CAS号是日常工作中常见的需求。以下是一些主要的信息来源:

  1. 化学品安全数据表 (SDS/MSDS): 这是最常用和最可靠的来源之一。根据全球许多国家和地区的法规要求,SDS必须在其第三部分或附近位置列出物质的CAS号。
  2. 化学品供应商的目录和网站: 销售化学品的公司通常会在其产品列表、技术规格或安全信息中提供CAS号。
  3. 在线化学数据库: 有许多大型在线数据库收录了大量的化学物质信息,其中包括CAS号。

    • 免费数据库: 如PubChem (美国NIH维护)、ChemSpider (英国皇家化学会维护)、Wikipedia (维基百科的化学条目通常会列出)。
    • 付费数据库: 如SciFinder (CAS自己的数据库,最权威和全面,但需付费使用)。
  4. 科学文献和专利: 在化学相关的研究论文、期刊文章、技术报告和专利中,物质通常会通过CAS号来标识。
  5. 政府监管机构的数据库: 许多国家的环保、职业安全或化学品管理部门维护着化学品清单,这些清单通常会包含物质名称和对应的CAS号(例如,美国TSCA清单、欧洲REACH注册数据)。

查找时建议交叉验证,尤其是在使用非官方或免费数据库时,以确保CAS号的准确性。

CAS号主要用在哪些地方?

CAS号的唯一性和通用性使其在化学、医药、环境、安全、法规等众多领域得到广泛应用:

  • 科研与学术: 在文献检索、数据库查询、论文写作中精确标识研究对象。
  • 化学工业与贸易: 用于化学品的采购、销售、库存管理、质量控制和物流,确保交易双方指的是同一种物质。
  • 安全与健康: 在SDS中作为核心标识符,链接到物质的危险性、安全操作、应急处理等信息。用于危险品分类和标签。
  • 环境管理与法规遵从: 政府机构利用CAS号建立化学品清单(如已知有害物质列表、限制使用物质列表),跟踪化学品的生产、使用和排放,执行环境法规。国际贸易中,海关也可能使用CAS号识别进口/出口化学品。
  • 专利申请: 在化学相关专利中,通过CAS号清楚地界定受保护的物质范围。
  • 数据库整合: 不同的化学数据库、毒理学数据库、光谱数据库等可以使用CAS号作为共同的连接键,方便用户在一个平台上获取来自不同源的信息。

目前有多少个CAS号?

CAS注册号系统的独特之处在于它是一个动态增长的数据库。CAS每天都会注册新的物质并分配新的CAS号。截至我知识更新的最后一个时间点(通常是2023年初),CAS数据库已经收录了超过2亿个独特的有机和无机物质以及超过1.7亿个序列物质(如蛋白质和核酸)。


这个数字持续增加,反映了化学研究和工业发展的活跃程度。它不仅仅是纯净的化学物质,也包括了大量的同分异构体、立体异构体、盐、混合物、聚合物、蛋白质序列等。

如何通过CAS号查找物质信息?

拥有一个CAS号,就可以像使用图书馆的书籍条码一样,快速找到相关“资料”。主要的方法是利用前面提到的各种数据库和资源:

  1. 使用在线化学数据库:

    • 在PubChem、ChemSpider等免费数据库的搜索框中直接输入CAS号进行搜索。这些数据库通常会返回物质的基本信息、结构图、物理化学性质、安全数据、相关文献链接等。
    • 如果你的机构订阅了SciFinder等付费数据库,这是最全面和权威的查找工具,可以获取极其详细的文献、反应、性质和法规信息。
  2. 查询供应商网站: 如果你知道是哪家供应商生产或销售这种化学品,访问他们的网站,通常可以通过CAS号搜索到产品的技术规格、价格和SDS。
  3. 查询政府法规数据库: 访问如美国EPA(环境保护署)、ECHA(欧洲化学品管理局)等机构的网站,可以通过CAS号查询物质的法规状态、毒理学评估报告等。
  4. 利用搜索引擎(谨慎): 虽然你可以在通用搜索引擎中输入CAS号,但返回的结果可能鱼龙混杂,建议优先选择来自权威机构、数据库或知名化学品供应商的搜索结果。

通过CAS号进行信息查找是其最核心的实际应用之一,大大提高了获取化学物质信息的效率和准确性。

如何验证CAS号的正确性?它是唯一的吗?

CAS号设计的一个重要特点是其唯一性。原则上,每一个分配的CAS号对应一个特定的、明确定义的化学实体。

关于唯一性:

  • 结构唯一: 对于具有明确结构的分子,CAS号通常对应其独特的化学结构。
  • 异构体不同: 同分异构体,即使分子式相同,但结构不同,它们会拥有不同的CAS号。例如,正己烷 (110-54-3) 和异己烷 (79-29-8) 的CAS号就不同。
  • 立体异构体不同: 即使是立体异构体(如对映异构体),如果其性质或用途有区别,也通常会被分配不同的CAS号。
  • 盐类不同: 相同酸根或碱基与不同的抗衡离子形成的盐,通常会有不同的CAS号。例如,苯甲酸钠 (532-32-1) 和苯甲酸钾 (582-25-2) 不同。
  • 水合物等不同: 有时,物质的不同水合物、溶剂合物或特定的晶型也可能被分配不同的CAS号,特别是当这些形式在性质上有显著差异时。
  • 混合物: 特定组成的混合物可以有CAS号,但这并不意味着混合物中的每个组分就没有自己的CAS号。往往是通过列出组分的CAS号来描述混合物。

所以,CAS号的“唯一”是针对CAS注册库中定义的特定实体的唯一标识。

如何验证CAS号的正确性?

验证一个CAS号是否正确或有效,有几种方法:

  1. 交叉核对: 在至少两个独立的、可靠的信息源(如权威数据库、官方SDS、知名供应商)中查询该CAS号,看它们是否都指向同一个物质名称和结构。如果多个可靠来源一致,则该CAS号很可能是正确的。
  2. 利用校验码(Check Digit): CAS号的最后一个数字是根据前几位数字计算得出的校验码。这个算法可以用来验证一个输入的CAS号格式上是否有效。

    校验码计算方法:
    将CAS号(不含短划线和校验码)从右向左,用1、2、3、1、2、3…作为乘数,将每位数字与对应的乘数相乘,然后将所有乘积相加。将总和除以10,得到的余数就是校验码。

    例如:CAS号 50-00-0 (甲醛)
    数字位是 5、0、0、0
    从右往左:
    0 * 1 = 0
    0 * 2 = 0
    0 * 3 = 0
    5 * 1 = 5
    乘积之和 = 0 + 0 + 0 + 5 = 5
    总和除以10的余数 = 5 % 10 = 5
    但是,甲醛的CAS号是50-00-0,校验码是0。这个例子不对。让我更正校验码的计算方式。

    正确的校验码计算方法:
    将CAS号(不含短划线)从右向左,将每一位数字乘以其位置权重(从右开始,权重为1, 2, 3, 4, 5…)。将所有乘积相加。将总和除以10,得到的余数即为校验码。

    例如:CAS号 50-00-0 (甲醛)
    完整的数字串是 5 0 0 0 0 (去掉短划线)
    从右向左的数字和其位置:
    第1位 (最右): 0 * 1 = 0
    第2位: 0 * 2 = 0
    第3位: 0 * 3 = 0
    第4位: 0 * 4 = 0
    第5位: 5 * 5 = 25
    所有乘积之和 = 0 + 0 + 0 + 0 + 25 = 25
    总和除以10的余数 = 25 % 10 = 5
    这个例子仍然不对,甲醛是50-00-0,校验码是0。

    再次更正校验码计算方法 (这是正确的算法):
    将CAS号(不含短划线和最右边的校验码)从右向左,将每一位数字乘以其位置权重(从右开始,权重为1, 2, 3, …)。将所有乘积相加。将总和除以10,得到的余数即为校验码。

    例如:CAS号 50-00-0 (甲醛)
    不含校验码的数字串是 5 0 0 0
    从右向左的数字和其位置:
    第1位 (最右): 0 * 1 = 0
    第2位: 0 * 2 = 0
    第3位: 0 * 3 = 0
    第4位: 5 * 4 = 20
    所有乘积之和 = 0 + 0 + 0 + 20 = 20
    总和除以10的余数 = 20 % 10 = 0
    这个结果与CAS号 50-00-0 的校验码 0 相符。

    再试一个:水 H₂O 的CAS号是 7732-18-5
    不含校验码的数字串是 7 7 3 2 1 8
    从右向左的数字和其位置:
    第1位: 8 * 1 = 8
    第2位: 1 * 2 = 2
    第3位: 2 * 3 = 6
    第4位: 3 * 4 = 12
    第5位: 7 * 5 = 35
    第6位: 7 * 6 = 42
    所有乘积之和 = 8 + 2 + 6 + 12 + 35 + 42 = 105
    总和除以10的余数 = 105 % 10 = 5
    这个结果与CAS号 7732-18-5 的校验码 5 相符。

    通过这种校验码计算,你可以初步判断一个CAS号在格式上是否可能正确。但请注意,校验码只能验证输入是否符合格式,不能保证该号码确实被分配给了你认为的那种物质,也不能检测出数字本身的错误(例如输入了另一个有效CAS号)。

    结合交叉核对和校验码检查是验证CAS号准确性的有效方法。

    CAS号是如何产生的或分配的?

    CAS号并不是由化学家或公司自己随便编一个。它是由美国化学文摘社(CAS)负责分配和管理的。当一个新的化学物质的信息被CAS的科学家们分析和收录到其Registry数据库时,这个物质就会被赋予一个独一无二的CAS注册号。

    分配过程大致如下:

    1. CAS的科学家们收集来自全球的科学文献、专利、商业出版物等信息,识别新的化学物质。
    2. 对于每一个新的物质,科学家会对其化学结构或组成进行详细分析和标准化描述。
    3. 将标准化后的结构信息输入到CAS Registry系统中。系统会检查这个结构是否已经存在于数据库中。
    4. 如果该结构是首次被注册,系统就会分配一个全新的、唯一的CAS号给它。
    5. 如果该结构已经存在,系统会返回已有的CAS号。
    6. 分配的CAS号是顺序递增的,但并不是按照物质发现或合成的时间顺序,而是按照它们被CAS注册的顺序。


    这个过程确保了每一个注册的物质都只有一个对应的CAS号,反之亦然(对于已经注册的物质)。CAS Registry数据库是维护这些CAS号及其对应物质信息的中央权威机构。申请一个新的CAS号通常意味着将一个新发现或合成的物质信息提交给CAS进行注册。


    cas号是什么