生物学常用符号誊写 规范
1、物种名称:
瑞典分类学家林奈的“双名法”(属名+种名+定名流 ),要求对物种学名属以上用拉丁文正体表现 ,属以下(包罗 属)用拉丁文斜体表现 ;属以上学名首字母大写,种名及亚种、变种名全小写。病毒的英文通用名称用正体巨细 写表现 [1] 。
2 、牝牡 性符号:
性别是生命的根本 属性之一。牝牡 性符号“♀ ”早就见于文献书刊,其出处已难于查考。中国遗传学奠定 人李汝祺在《发生遗传学》一书中曾提到其泉源 ,是以古希腊神话中女神Venus的镜子“♀”作为雌性的标记 ,以战神Mars的矛和盾“♂”作为雄性的标记 。必须留意 的是,雄性符号的谁人 箭头是指向右上方而不是正上方 ,但如今 一些编辑排版软件的符号库里只有箭头向正上方的符号,这是错误的,从继承 人类文化遗产的角度 ,发起 排版软件及各类字库、符号库的计划 者们留意 这一题目 ,不要随意改动这一天下 通用的传统符号。
3、氨基酸的缩写:
天然 界有20种常见氨基酸,其三字母符号为其英文名称前三个字母 ,首字母大写;单字母符号除两种酸性氨基酸(天冬酸D 、谷氨酸E)、两种酰胺(天冬酰胺N、谷氨酰胺O) 、两种碱性氨基酸(赖氨酸K、精氨酸R)和三种芳香族氨基酸(苯丙氨酸F、酪氨酸Y和色氨酸W)外,别的 均为其英文单词首字母的大写。
4 、核苷酸碱基缩写:
A(腺嘌呤)、G(鸟嘌呤)、C (胞嘧啶) 、T(胸腺嘧啶)、U(尿嘧啶) 。
5、免疫球卵白 :
免疫球卵白 (immuno globulin, Ig)的缩写有IgA、IgD 、IgE、IgG、IgH 、IgM、IgY等。
6、血红卵白 :
血红卵白 (hemo globin)的缩写有HbA 、HbH、HbF、HbCS 、MHb等。
7、细胞色素:
细胞色素a、b 、c、d以英文小写字母表现 。细胞色素P2450系列,如P12450、P2450c、P2450Κ 、P32450等,一样平常 将此中 的“P ”排为大写 ,“450”与“P”平排,用对开毗连 线毗连 (另请留意 此中 要排成下角标的地方)。发起 以此同一 。
8、维生素:
以英文大写字母A、B 、C、D、E等表现 ,其族内编码以阿拉伯数字下角标(如B1 、B2、B12等)表现 。
9、基因在染色体上的定位:
比方 编码Wilms瘤的WT-1基因定位于人11号染色体短臂1区3带 ,以平排的11p13表现 ;编码肝癌的RA-1基因定位于16号染色体长臂2区2带1亚带至2区3带2亚带,以16q22.1~q23.2表现 ,发起 不要误排为16q22.1~q23.2。
10 、基因与其表(现)型产物符号:
基因(核酸)与其表(现)型产物(卵白 质)在遗传学上是完全差别 的两种概念。基因符号用斜体、表型产物符号用正体的表现 法起首 于50年代初由一位南斯拉夫细菌遗传学家提倡 ,很快被学术界所担当 ,并推广到全部 物种。差别 物种的基因符号同等 斜体,其表型、产物符号同等 正体 ,这不是什么集会 会议 和机构的逼迫 规定,而是半个世纪以来国际学术界已经约定俗成的通用写法 。由于天然 界物种繁多,基因范例 繁杂 ,又渐渐 形成了以巨细 写字母的变更 、前后缀、上下角标等标记 来区别物种属性、基因所代表特定表型的突变如显陷性、抗性 、对环境 条件的敏感性等特性 的约定,并通过国际上厥后 连续 创建 的有关各物种遗传符号定名 委员会简直 认与公布,如许 ,物种的基因符号和表型产物符号也就同时包罗 了其所属物种和基因功能特性 的信息。这些寄义 丰富的符号对于简化笔墨 叙述起了很好的作用。
现依据闻名 分子生物学杂志Trends in Genetics1995年3月归纳发表的“遗传符号定名 引导 细则(TIG nom enclature guide) ” ,以及我们已往 翻译过的W.H.Freeman Company、Cold Spring Harbor Laboratory Press、John Wiley Sons, Inc.等的书刊,将基因及其表型产物符号的用法举例列表如下,供参考 。
物种的基因及其表型产物的符号誊写 :
解释 :编辑审稿时 ,依附 肯定 的生物学知识,应能对符号是代表基因还是 代表其表型产物举行 判定 。比如 ,碰到 (×××代表符号)“×××编码某卵白 ” 、“×××的转录”、“×××的外显子/内含子 ”、“×××cDNA” 、“×××的产物”、“×××翻译产物 ”、“×××所含核苷酸…”之类的笔墨 ,一样平常 可判定 该符号代表基因,应排斜体;如果 见到“×××素” 、“×××酶”、“×××因子 ”、“×××含…氨基酸/…肽” 、“×××的分子量”、“×××复合物 ”、“×××亚单位 ”、“×××二聚体” 、“转录因子××× ”、“×××介导的…”等等,则一样平常 可断定该符号代表产物 ,应排正体。碰到 “×××的表达”、“×××卵白 ” 、“×××基因”这类含糊其词 的笔墨 ,若根据上下文难以判定 ,发起 向作者问清楚 。由于各物种的基因符号是在学科发展的具体 汗青 中形成的 ,缺乏划一 的划一性。比方 ,上角标“r”在某些真菌和质粒基因符号上是抗性标记 ,而在果蝇基因符号上就成为相对于显性“D ”的隐形突变标记 ,而“rv”则为复兴 突变标记 ,等等。基因符号的复杂性要求编辑必须做好编前工作,最好要求作者本身 将符号的正斜体、前后缀、上下角标(及其正斜体)誊写 标注清楚 。至于审稿时作某些质疑,也是编辑责无旁贷的帮忙 作者定稿的工作之一。
表现 突变型基因的符号 ,应该在座位符号右上角加上“+”或“-”来表现 。比方 hisA-表现 组氨酸缺陷型基因,hisA+表现 相应的野生型基因,与链霉素抗药型有关的基因座位称为strR(或str-r) ,敏感的野生型基因是strS(或str-s) 。别的 尚有 一些常见的基因符号代表特定的意义,譬如,inc代表不亲和性 ,rep代表复制,tra代表转移,fin代表致育克制 ,ori代表复制出发点 ,Dam代表DNA腺嘌呤甲基化酶等等[2]。
10.1酵母:
裂殖酵母(Schizosaccharomyces pombe):基因符号由3个小写斜体字母与1个阿拉伯数字构成 ,如arg1 、leu2、cdc25、rad21。同一基因座上的差别 等位基因,在基因座符号后用连字符加上等位基因特异的后缀来定名 ,如ade6-M26 、ade6-469。特定基因的野生型等位基因用上标“+ ”表现 ,如arg1+ 。卵白 质用相应基因的基因符号表现 ,正体且首字母大写 ,如Arg1、Leu2、Cdc25 、Rad21。
酿酒酵母(Saccharomyces cerevisiae):基因符号由3个斜体字母与1个阿拉伯数字构成 ,此中 ,字母小写表现 隐性 ,大写表现 显性,如ade5、cdc28、CUP1、SPC105,等位基因的名称包罗 基因符号 、连字符和1个斜体誊写 的数字 ,如act1-606、his2-1。卵白 质用相应的基因符号定名 ,正体首字母大写且加上后缀“p”,如Ade5p、Cdc28p 、Cup1p、Spc105p 。
10.2植物:
莱哈衣藻(Chlamydomonas reinhardtii):基因符号由3个大写斜体字母构成 。具有雷同 名称的差别 基因座厥后 加阿拉伯数字以示区别 ,如TSB1、TUD1 、TUB2、ARG7,野生型等位基因用大写斜体字母和阿拉伯数字(不消 “+”上标)表现 ,如TSB1。突变型等位基因用小写斜体字母表现 ,同一基因座的差别 突变型等位基因用连字符将序号与基因名分开 ,如maa1-1 。卵白 质用相应的基因名称表现 ,正体大写,如TSB1、TUD1 、TUB2、ARG7。
玉米:基因符号由3个小写斜体字母和1个阿拉伯数字构成 ,如dek1、dek12 、adh1,由于玉米是一种高度多态性的物种,有很多 特别 的突变体和非突变体等位基因 ,因此玉米的每个等位基因险些 都有1个后缀,后缀与基因符号间用连字符隔开。此中 隐性等位基因小写,显性与共显性等位基因首字母大写 ,如dek12-4567、Dek12-W23 。卵白 质的符号与相对应的基因雷同 ,但为正体大写,如DEK1、DEK12、ADH1。
豌豆:基因通常由3个斜体字母构成 ,如首字母大写,别的 2个字母小写表现 显性突变的基因,隐性突变基因的3个字母皆为小写,如Gty 、bot、lam ,但早期的基因符号变革 较大,1~4个字母不等,如a、b 、aerc、coch ,显性等位基因首字母大写,而隐性等位基因字母全部小写。如Np、Sym4 、cry、d 。卵白 质用相应的基因名称定名 ,正体大写 ,如UNI。
拟南芥(Arabidopsis thaliana):野生型基因符号由3个斜体的大写字母构成 ,可用差别 的编号区分具有雷同 字母符号的差别 基因座,如EMB1。突变体基因符号用相应的基因座名称的3个小写斜体字母定名 ,如det1,雷同 基因座的差别 等位基因的定名 在基因名后加1个连字符和1个数字表现 ,如det-1、det-2(假如 仅知道1个等位基因 ,则可以不加连字符,比方 只知道1个等位基因时,abc3=abc3-1),显性和隐性等位基因不必要 特别 地区 分 ,也答应 在某个等位基因名称的背面 加1个D表现 显性,如abc5突变体等位基因2在杂交中对野生型是业性的,可以用abc5-2D 表现 。卵白 质常用相应的基因符号定名 ,且正体大写,如EMB1 、EMB2、DET1、DET2 。
10.3动物:
奇丽 新小杆线虫(Caenorhabditis elegans):基因符号由3个小写斜体字母 、1个连字符和1个阿拉伯数字构成 ,如dpy-5、dfy-2、let-3、mlc-31 、unc-13 ,野生型等位基因在基因名后的括号内用1个加号表现 ,如dpy-5(+)、let-37(+),突变体等位基因在括号内用1个表明突变体的编号和所泉源 的实行 室的后缀 ,即等位基因要加1个实行 室埋头 的符号,如e表现 英国剑桥大学MRC实行 室,mn表现 Minnesota州立大学的R.K.Herman实行 室 ,如dpy-5(e61)、let-31(mn138)。等位基因隐性和显性(以及其他)特性可以用1个正体后缀表现 (如dm表现 显性,ts表现 温度敏感),如unc-1(e1598dm) 、fem-(1hc17ts)。卵白 质用相应的基因名称定名 ,以正体大写字母表现 ,如DPY25、DFY22、LET237 、MLC23、UNC213 。
果蝇(Drosophila melanogaster):基因符号通常采取 基因名的缩写,斜体誊写 ,小写表现 隐性突变基因 ,首字母大写表现 显性突变基因,或采取 卵白 质名来定名 的基因,如sev、al 、mal、ftz、Dfd 、Sos、Ace ,等位基因用上标符号(最好不高出 3个字符)加以区别,上标字符可从a~z、A~Z、0~9~+~-等中选用,如sc1 、mejp、mysts1。卵白 质用相应的基因符号来定名 ,正体大写,如SEV、FTZ 、AL、MAL、DFD 、SOS、ACE、SU(WA)。
斑马鱼(Zebra fish):基因符号用3个小写斜体字母表现 ,中心 无连字符 ,同一基因家属 中的差别 基因成员则按次序 编号,如cyc 、brs、eng1、eng2 、ntl,等位基因分别用上标的“+ ”号或“-”号表现 野生型或突变型 。如cyc+、brs+、eng1+、eng2- 、ntl-。卵白 质符号与基因符号雷同 ,但为正体且首字母大写 ,如Cyc、BRS、Eng1 、Eng2、Ntl。
鸡(Chick):基因符号仅由斜体大写的字母和阿拉伯数字构成 ,无任何标点或上下标,如H5、BMP1 ,等位基因由斜体大写的字母和阿拉伯数字构成 ,用星号将基因符号与特异的等位基因符号隔开,如H5*1 、BMP1*A(留意 *并非上标) 。卵白 质的定名 与基因雷同 ,但为正体,如H5、BMP1[3]。
11、转座子符号:
依据前述国外文献,差别 物种的表现 方式略有差别 。细菌的转座子是符号正体 ,编码斜体,如:IS3 、Tn9等;玉米的转座子则全部斜体,如Ac、Ds、Ma1等 。
12 、基因工程工具:
12.1 限定 性内切核酸酶:
近20年来 ,较为正规的出书 物均按下述规范誊写 ,即前三字母是酶源物种学名部分 的简写,斜体;背面 的字母和编码全部正体平排。比方 :EcoRⅠ、HindⅢ、BamHⅠ、SalⅠ 、BglⅡ、AvaⅠ、HinfⅠ 、MboⅡ、AsuⅠ、HphⅠ 、TaqⅠ等。
核酸限定 性内切酶的定名 起首 是由Smith和Nathams于1973年提出的,1980年Roberts在此底子 上举行 了体系 分类 ,总规则是以内切酶泉源 的微生物学名举行 定名 。Ⅱ型核酸限定 性内切酶是基因工程中最常用的工具酶之一,它的定名 要点有:
限定 酶的名称由3个字母构成 ,第1个字母采取 细菌属名的第1个斜体大写字母 ,第2和第3个字母采取 细菌种名的前2个字母,需斜体小写 。如大肠杆菌(Escherichia coli)用Eco表现 ,流感嗜血菌(Hacmophilus influcnzac)用Hin表现 。第4个字母表现 菌株的范例 ,用正体,如Hind中的d代表流感嗜血菌d株。从同一种微生物中发现多种限定 酶,则依照发现和分离的先后次序 用罗马数字表现 ,罗马数字用正体 。如流感嗜血菌d株有多种限定 酶,则分别表现 为HindⅠ、HindⅡ、HindⅢ等。
根据以上定名 要点,从淀粉液化芽孢杆菌(Bacills amyloliquef aciens)H株中分离的第1种限定 性内切酶 ,定名 为BamHⅠ[2]。
12.2 重组基因载体:
(1) 病毒缩写一样平常 为正体,其编码在较多出书 物为平排 。如:T4 、T7、Ch30、SV40 、M13、Ch1、ΦX174等。
(2) 质粒同等 正体,一样平常 首字母为小写p,背面 的字母和数码平排。如:pBR322、pMC9 、pDF41、ColEⅠ(pVH51)、pUC119等;粘粒有pJC720 、pJB138、pTL5、pHS262 ,以及MuA23 、MuA210等 。
新发现或改造的质粒定名 第1个小写字母p表现 质粒(plasmid),背面 2个或3个大写字母表现 构建该质粒的研究职员 的姓名或实行 室名称,末了 的数字表现 构建的一系列质粒的编号。如pUC118 ,p代表质粒,UC代表研究职员 姓名的英文缩写,118代表该质粒的编号。
对于天然 存在的质粒仍旧 利用 原有的定名 ,如:ColE1、F、SCP1等 。
质粒中的缺失和其他范例 重排的定名 与细菌基因组中的缺失和重排的定名 雷同 。譬如:缺失了基因cad与asa的质粒定名 为pI258Δ(cad-asa7)。
质粒载体抗药性的符号规定用大写字母表现 表型,用雷同 的3个小写字母表现 基因型,比方 四环素抗药性的表型用TcR表现 ,基因型用tet表现 。氨苄西林抗药性的表型符号用ApR表现 ,基因型用amp表现 (是ampicillin的前3个字母)或bla(β-内酰胺酶,是βLactamase的前3个字母)表现 [2] 。
(3) 噬菌体的定名 :
噬菌体基因的定名 用其表型或基因产物单词的1~3个斜体的字母 ,大写或小写均可,如:N 、cI、int等。当几个基因突变产生雷同 表型时,可加上罗马数字编号区分,如cⅠ、cⅡ 、cⅢ ,其基因产物可用gp加上基因名称表现 ,如gp43,或是在基因名称后加上“卵白 ”两字 ,如cI卵白 。
表型与基因产物的定名 不消 斜体,但第1个字母要大写,如N、Int 。
溶源性噬菌体在细菌染色体中的附着部位通常定名 为att位点 ,厥后 是所对应噬菌体的定名 ,如attΚ、attP4、attHK022等[2]。
13 、细胞株缩写:
有的有惯用缩写,比方 :HeLa细胞株已约定俗成 ,不应写作Hela细胞株。
14、计量单位 :
除一样平常 法定的计量单位 之外,生命科学中尚有 一些专用计量单位 如:碱基对bp、核苷酸数nt 、分子量Da(道尔顿)、基因图距cM(厘摩尔根)、每分钟转数r/min 、每分钟计数cpm、沉降系数S、离心机重力加快 度(用斜体g),以及压强Pa 、摩尔浓度mol/L等 。
15、有关统计学和数学符号:
代表一系列变量的符号一样平常 用斜体表现 ,如样本含量N或n、总体参数(均匀 差μ,标准 差σ,方差σ2或V) 、样本统计量(均匀 数,标准 差S ,方差S2)、变异系数(CV)、t值、F值 、卡方值χ2、概率值P、平方和SS 、乘积和SP、均方MS、相干 系数r 、回归系数b、通径系数p、函数f(x) 、偏导数、矩阵和向量(黑体的X、Y)等等。代表非变量的符号,如微分符号d 、协方差Cov或Var等用正体。一些标注性符号和常数也用正体,如量大值max、最小值min、极限lim、天然 对数ln 、常用对数log(以10为底的对数lg)、正弦sin、余弦cos 、正切tg ,以及常数e和π等等 。在誊写 公式时,请留意 不要将变量符号与基因符(代)号相肴杂 。
参考文献:
[1] 刘安,马学海 ,丁海珈,姚坚忍 。谈谈生命科学出书 物中符号利用 的规范化 。生物技能 通讯,1999 ,10(1):73-76。
[2] 肖业臣,魏剑波。基因工程中常用术语的定名 规则。生物学转达 ,2002 ,37(10):11 。
[3] 张冰。科技期刊中基因及卵白 质的规范表达。学报编辑论丛,2007,81-86
文献泉源 :丁香园论坛