引物设计页面分为用户输入和参数设置两个部分。只有提交了用户输入中的项目,您才能获得引物设计的结果。
[ 必要 ] Fasta 格式的模板序列文件
对于 fasta 中每条序列的描述行(以 > 符号开头),我们使用 "|"
符号分隔不同的序列属性,描述的序列属性依次包括分子标记的名称、分子标记的位置。 此外,我们建议每个 fasta 序列长度大于 600bp,以获得更好的引物设计结果。
描述行模板:> marker_name | marker_area
marker_name 分子标记的名称,推荐使用英文字母与阿拉伯数字命名,避免出现空格以及不规范字符。
marker_position 为了确保突变序列的测序质量,目标位点位于正向目标特异性引物的 150nt 以内或反向目标特异性引物的 118nt 以内,序列上的碱基从 1 开始计数,包含两种写法:
"-"
符号间隔。如 301-304 ,表示下一行序列上的第 301 到第 304 个碱基范围内的 4 个碱基为分子标记,且对于 SNP 标记,也有等价表述,如 348-348 ,与第一种写法表述一致。因此,这种形式的表述适用于绝大多数分子标记。数据格式
>marker1|301 TTTGCCACTTAAACGTTGGCTCCTTGACTGTGTCATGTGTCCATGTGTGTCGATTCTGAAAGATTCCTTCTCCTTGGGTGTTCAGTTTCTTGATTGATGAAAATTGCCTGGCTAACTAATCTGTGTTTCCTCGCCAGGCAATTGCGCTCTGCCCCGACGTCGCCGTCTACTGGATCAATCGGGCCCTGTGCCATTTCAAGCGCAAGTGAGCGACTTTACTTTTTGTTGCCTCCCTTCCTGGCAAGAAAGAAACAAACGTCTGGAATAGTAATCTTTGTGCACAGGGAGTGGGCCAAGGTCGAAGAGGACAGCAGGAGGGCTCTTGCGCTTGATTACACTTTAGTCAAGGTCACATTCTTGTTTCTTCTTTCGTCTCAAAACTAAAGCGCCGACTTCAGTTACCTCTACATTATGTAATCGCTATTCTTAACTAACCGTTTGACACCAATAAAGATACAAAAGTAAGTAGCCGTGATTATTCCGTTCCTTGTGTGATGTAGGGGCACTATCTGCTGGGGTGTGCGCTACTCGAGAAGGAAGAATCTGCTCTTGCTATCAAGGAATTCGAAAAGGTTTACCTCAACCGTTTGTCTCTTGCACG
>marker2|301-304TGCTCGGATGTGACTGAGTGACGACGATCACGGTGCAGTTTCTTGTCAATTCTTCGGGTCGAATGCTCGCAGCAGACGACTGAGGCCGTGATCAAGCGGTGGACGACGGTGACGGAGATCATAGGGAAGGCCATGGTCGCCATGCGGAGGCAGCTGTACGCGCAGAACCCAGGCGCCTTCGACGGTTTCAGGGACGAATACTTGCTGGCCATCGCGGAGAACCGCATCCTGATCCTGCTCGACTTCGCCAACGGATTCACCAGCATCACGTCGCACGAGAAGCTCGTGTACATGCTCGGCATGTACGAGGCTCTCACCGACGCCGCTCCCAGCCTCCTGCTCCTCCTCAGCGGCGCGCGCAAGGAGGCCATCTCGGAGCGGACACAAGGTATCCTCACGAAACTGGCCGGCGCGGTGAGGATCATGGTCAGCGGCGCCATAGCCAAGATCCAAGGCGACTCACTGTTCCCGCACACGCCGAGCGCCGCAGGTGGCGTCCACCCGCTGACACGCAACGCCATGACCTGCGTCGAGCTGCTGGCGAGGCACCGCACCACGCTCGATCTGATCCTCGCGGGCGCCGACGAGCGCAGCTCCCTCGCC>marker3|348-348ATTATATCCCAAGTGAACCTAAAAGTTCTCCCACACAACGACGCAGGGTTTTACAAACAACCACCAAGGGCATGTTGTGGCGCGCCTGGGAGGGGTCCTTACAATTTCAACCTGACAGCGAAGTGCGGTGAGCCTGGTGCCTCGGCTTGCGCTGATCCTAAGACGCACTGGAGCTGGGATGGTATTCACTTGACAGAAGCCGCGTATCTGCACATTGCCAGAGGCTGGCTTCATGGACCGTTCGCAGACCAGCCTGTTGTACAAGCATCTTGAGTAATGTTGTGGCGCGCCTGGGAGGGGTCCTTACAATTTCAACCTGACAGCGAAGTGCGGTGAGCCTGGTGCCTCGGCTTGCGCTGATCCTAAGACGCACTGGAGCTGGGATGGTATTCACTTGACAGAAGCCGCGTATCTGCACATTGCCAGAGGCTGGCTTCATGGACCGTTCGCAGACCAGCCTGTTGTACAAGAGGGCATGTTGTGGCGCGCCTGGGAGGGGTCCTTACAATTTCAACCTGACAGCGAAGTGCGGTGAGCCTGGTGCCTCGGCTTGCGCTGATCCTAAGACGCACTGGAGCTGGGATGGTATTCACTTGATGAGTACAGTACACCCAGCCTCTCCTCCCTGCTGTTCTTGCACCTCTAGAGTGAGTGGCCACAATAGCACACACCGTGCGTGACACCAAACTGGATCCGATAAGGTA注意
如果有不符合约定格式的 fasta 序列,则不会输出该序列的引物设计结果,会跳转到下一个序列尝试设计引物。
默认参数包括引物长度、PCR 产物长度和 Tm 值的最小值、最佳值和最大值。 同一次提交的 fasta 文件里所有序列都使用这组参数来批量设计引物。在设计流程中,会先使用这 9 个参数进行常规引物的序列设计,并在返回的引物序列上添加特定的序列。
结果页面仅在页面上呈现第一条序列的引物设计结果,您需要点击结果页面下方的 "Download all primers"
按钮下载所有的引物设计结果。
表头
标记名称、左引物序列、右引物序列、左引物 5' 端起始位点、右引物 5' 端起始位点、左引物长度、右引物长度、左引物 Tm 值、右引物 Tm 值、左引物 GC 含量、右引物 GC 含量、产物长度
根据不同的应用方向,iBP-seq 可分为用于基因分型的 iBP-genotyping 方法和用于甲基化水平检测的 iBP-epigenotyping 方法。
您可以直接点击提交页面的 demo 按钮运行预置的示例,当然您也可以自行提交 iBP-genotyping 分析所需的以下信息。
[ 可选 ] 参考基因组
您可以从下拉框中选择现有的参考基因组,或自行上传参考序列。
[ 必要 ] Barcode 信息
您在实验中使用的 barcode 序列,它们的长度均为 8bp, 每行 barcode 序列对应一个样本。
[ 必要 ] 突变信息
数据格式
CHROM Pos REF ALT 7 131102379 C G 3 14591067 C CGGAGGA zong31 28 GCCG GCCGGA zong31 33 ATGCACCG A 注意
这里 zong31 是自定义参考序列的名称,这个例子只是为了展示可选突变信息格式的多样性,包含 SNP, Insert, Deletion 以及复杂突变,均可用此法进行基因分型的检测。
[ 必要 ] Fastq 文件
由二代测序生成的双端 fastq 文件。 我们更推荐以 .gz 压缩格式上传文件,这将进一步节省您的上传时间。
[ 必要 ] 电子邮箱地址
用于接收分析结果的有效电子邮件地址。
文件上传完成后,您可以离开网站并等待结果的电子邮件通知。
PNG 图像文件帮助您从宏观角度观察基因分型的结果和效率,xlsx 文件告诉您每个基因型的详细信息。
PNG
每张图片对应单个群体的基因型结果,图片的标题也以(chromosome_locus_REF_ALT,与变异信息文件的内容相同)格式标注,便于区分。 x 轴上的每个 rug 代表一个样本数据,其对应的 x 轴值代表该位点发生突变的碱基在测序数据中所占的比例(简而言之,
XLSX
第一列按顺序每个 num 对应于一个样本。 第二列对应于每个样本在该位点的 ALT 碱基的等位基因频率。 第三列0、1、2代表三种不同的基因型,分别对应 KDE曲线上从左到右的三个峰。
数据格式
Num Frequency Genotype ... ... ... 6 0.057692 0 7 0.909091 2 8 0.45045 1 ... ... ... 表头
样本编号、Alt 基因型的等位基因频率、样本基因型
您可以直接点击本页面的 demo 按钮运行预设的例子,当然您也可以自行提交 iBP-epigenotyping 分析所需的以下信息。
[ 必要 ] Barcode 信息
每行由 8bp 条形码序列和相应的参考序列名称组成。
数据格式 ATCACGTT,B73/Mo17 CGATGTTT,B73 TTAGGCAT,Mo17 TGACCACT,W22 ACAGTGGT,SK GCCAATGT,B73/Mo17/SK/W22 TGGTTGTT,B73/Mo17 ...
格式说明
barcode 序列,参考序列_1/参考序列_2/...(barcode 序列与参考序列之间用 “,” 隔开,多个参考序列之间用 “/” 隔开)
[ 必要 ] 参考基因组
您需要提交一个包含多个参考序列的 fasta 文件进行比对。
数据格式
>1-B73 ATCCACGTCGCCAGAAATTCTTCACGCCGCTAGATTGTAAATCAATGGCTTCTATCCATCGTTGTATCGGTGGCGTGTGGAATGTCTCTTCTCACTCCTTCCGCTTCTCGAGACTTCCATGGTTGGCCCGTGCAGTGCATGCCTCTCCTCGCTCCCTTCGTCTCTCTGCCAGCTGCTTCACCTTCTGCCGCTTTGATCGTCCACTTCACTCCAGCACAGTCGCGTCGTCTACTGTCGCCTTCATCGTCTGCTTCGATGTTTGGTGATATCCATCACTTTCTTCATCGGCTCCACTTCCTCGTCGAGTTGCTGTTTCTTTCATTGGGGTTTCGAAGGGTGTGTTTGGTTGGATGTACATGGAGGGATGGAATAAGGTGGCCACATTTTCAATAGTGTTTGGA
>1-Mo17ATCCACGTCGCCAGAAATTCTTCACGCCGCTAGATTGTAAATCAATGGCTTCTATCCATCGTTGTATCGGTGGCGTGTGGAATGTCTCTTCTCACTCCTTCCGCTTCTCGAGACTTCCATGGTTGGCCCGTGCAGTGCATGCCTCTCCTCGCTCCCTTCGTCTCTCTGCCAGCTGCTTCACCTTCTGCCGCTTTGATCGTCCACTTCACTCCAGCACAGTCGCGTCGTCTACTGTCGCCTTCATCGTCTGCTTCGATGTTTGGTGATATCCATCGCTTTCTTCATCGGCTCCACTTCCTCGTCGAGTTGCTGTTTCTTTCATTGGGGTTTCGAAGGGTGTGTTTGGTTGGATGTACATGGAGGGATGGAATAAGGTGGCCACATTTTCAATAGTGTTTGGA>1-SKATCCACGTCGCCAGAAATTCTTCACACCGCTAGATTGTAAATCAATGACTTCTATCCATTGTTGTATCGGTGGCGTGTGGAATGTCTCTTCCCGCTCCTTCCACTTCTCGAGACTTCCATGGTTGGCCCATGCAGTGCATGCCTCTCCTCGCTCCCTTCGTCTCTCTGCCAGCTGCTTCACCTTCTGCCGCTTTGATCGTCCACTTCACTTCAGCACAGTCGCGTCGTCTACTGTCGCCTTCATCGTGTGCTTCGATGTTTGGTGATATCCATCGCTTTCTTCATCGGCTCCACTTCCTCGTCGAGTTGCTGCTTCTTTCATTGGGGTTTCGAAGGGTGTGTTTGGTTGGATGTACATGGAGGGATGAAATAACGTGGCCACATTTTTAATAGTGTTTGGA ...
[ 必要 ] Fastq 文件
由下一代测序生成的双端 fastq 文件。 我们更推荐以 .gz 压缩格式上传文件,这将进一步节省您的上传时间。 您也可以从网站上下载一对完整的演示。
[ 必要 ] 电子邮箱地址
用于接收分析结果的有效电子邮件地址。
文件上传完成后,您可以离开网站并等待结果的电子邮件通知。
PNG 图像文件帮助您从宏观角度观察表观基因分型的结果和效率,而 csv 文件告诉您每个个体基因型的详细信息。
PNG
对应于几个参考序列的三种不同甲基化类型的结果。
CSV
每个参考序列相应位置的甲基化类型的详细信息。
数据格式
chr pos context C_count CT_count ratio 1-B73 68 CG 2662 3965 0.671375 1-B73 86 CHH 714 3969 0.179894 1-B73 128 CHG 1814 3969 0.457042 表头
染色体名称、位置、甲基化类型、二代测序 Reads 中 C 的数量、二代测序 Reads 中 C 和 T 的总数量、二代测序 Reads 中 C 的数量占 C 和 T 总数量的比例
Copyright (c) Li Lab of HZAU, All rights reserved.