معلومة

كيفية استرداد قائمة أسماء الجينات الكاملة ومعرفات جينات Entrez ومعلومات الشرح الأخرى من قائمة أسماء الجينات HUGO (في R أو أي منها)؟


كيف يمكن استرداد أسماء الجينات الكاملة ومعرفات جينات Entrez ومعلومات الشرح الأخرى من قائمة أسماء الجينات HUGO (في R أو أي برنامج أو لغة أخرى)؟

هل من الممكن العكس: الحصول على أسماء جينات كاملة أو معرفات الحصول على أسماء HUGO أو بيانات التعليقات التوضيحية الأخرى؟


أوصي فقط بتنزيل قاعدة البيانات ، والتي تتيح لك HUGO القيام بها مجانًا.

يحتوي موقع ويب HUGO على علامة تبويب "تنزيلات" في الأعلى تنقلك إلى الصفحة التالية

http://www.genenames.org/cgi-bin/statistics

سترى جدولاً إحصائيًا يتعلق بعدد الجينات المشفرة للبروتين أو غير البروتين المفهرسة ، إلخ.

تحت الجداول قسم يسمى روابط تنزيل مجموعة البيانات الكاملة - هذا هو القسم الذي تريده (إلا إذا كنت تريد فقط مجموعة فرعية من البيانات - ولكن لماذا لا تحصل عليها كلها!)

يمكن تحميل هذا الملف النصي العادي (مرة واحدة غير مضغوط) إلى R (أو أي لغة أخرى) ليتم تحليله وتحليله وفقًا لمتطلباتك.

يجدر تحديث الإصدار الذي تقوم بتنزيله بانتظام ، حيث يقومون بتحديث قاعدة بيانات HUGO بمعلومات جديدة / محدثة بانتظام.


قم بتثبيت موصل حيوي واستخدم هذه المكتبة: http://www.bioconductor.org/packages/release/bioc/html/biomaRt.html

يمكنك الوصول إلى BioMart الذي يتيح لك الترجمة بين أنواع المعرفات المختلفة


جينسير: حكيم لأسماء الجينات والموارد الجينومية

أدى التحديد المستقل للجينات في الكائنات الحية المختلفة والفحوصات إلى العديد من الأسماء لكل جين. تجعل هذه البلقنة من الصعب استخدام أسماء الجينات لتحديد موارد الجينوم والمتماثلات في الأنواع الأخرى والمنشورات ذات الصلة.

أساليب

نقوم بحل مشكلة التسمية من خلال جمع البيانات من مجموعة متنوعة من المصادر وبناء قاعدة بيانات ترجمة الأسماء. لقد قمنا أيضًا ببناء جدول متماثلات عبر العديد من الكائنات الحية النموذجية: H. العاقل, M. العضلات, R. norvegicus, D. melanogaster, C. ايليجانس, S. cerevisiae, S. بومبي و A. thaliana. يسمح هذا لـ GeneSeer برسم أشجار النشوء والتطور وتحديد أقرب المتماثلات. وهذا بدوره يسمح باستخدام أسماء من نوع ما لتحديد الجينات المتماثلة في الأنواع الأخرى. يرتبط موقع ويب http://geneseer.cshl.org/ بقاعدة البيانات للسماح بوصول سهل الاستخدام إلى أدواتنا ومواردنا الجينية الخارجية باستخدام أسماء جينية مألوفة.

استنتاج

يسمح GeneSeer بالوصول إلى معلومات الجينات من خلال الأسماء الشائعة ويمكنه تعيين التسلسلات للأسماء. يسمح GeneSeer أيضًا بتحديد المتماثلات والمماثلات لجين معين. يمكن الوصول إلى مجموعة متنوعة من البيانات الجينومية مثل التسلسلات ، والنماذج المتعددة الأشكال ، ومتغيرات لصق ، وأنماط التعبير وغيرها من خلال واجهة GeneSeer. وهي متاحة مجانًا عبر الويب http://geneseer.cshl.org/ ويمكن دمجها في أدوات أخرى من خلال واجهة برمجية قائمة على http الموضحة على موقع الويب. يتم استخدامه حاليًا كمحرك بحث في مورد مخطوطة RNAi ، وهو بوابة لتركيبات إسكات الجين RNA (shRNA) قصير الشعر.


مقدمة

التنميط التعبير الجيني للأنسجة مهم لدراسة وظيفة الجينات. غالبًا ما يمكن الحصول على أدلة على وظيفة الجينات من خلال فحص متى وأين يتم التعبير عن الجين في الأنسجة وخطوط الخلايا. تساعد أنماط التعبير الجيني في الأنسجة المختلفة وخطوط الخلايا التي تم الحصول عليها من خلال طرق القياس الكمي المختلفة على استنتاج وظائف الجينات غير المألوفة بشكل صحيح بالاقتران مع الشرح الوظيفي المتاح للجينات.

تتراكم بيانات التعبير الجيني بشكل كبير مع تقدم طرق قياس التعبير الجيني على مقياس الجينوم. كانت المحاولة الأولى هي قياس التعبير عن طريق حساب عدد علامات التسلسل المعبر عنها (ESTs) المتسلسلة بواسطة طرق Sanger التقليدية في أنسجة مختلفة 1،2. بعد اختراع ميكروأري ، سرعان ما تم استخدامه لتحديد ملامح الأنسجة في مشروع التعليقات التوضيحية الوظيفية للثدييات (FANTOM) 3-5. تم بذل جهد مماثل لمصفوفات Affymetrix GeneChip الدقيقة بواسطة مجموعة BioGPS 6.

بالتزامن مع التقدم في تقنية تسلسل الحمض النووي الريبي (RNA-seq) ، أصبح تحديد مواقع بدء النسخ عالي الإنتاجية ممكنًا باستخدام تحليل غطاء التعبير الجيني (CAGE) ، الذي طورته مجموعة RIKEN 7. باستخدام هذه التقنية ، أصدر اتحاد التعاون FANTOM تيرابايت من بيانات تسلسل النسخ من خطوط الخلايا الأولية لأنسجة الإنسان والفأر البالغة والجنين والتي تم الحصول عليها بواسطة مشروع FANTOM5 8،9.

يعد توفر مثل هذه البيانات مفيدًا جدًا لعلماء الأحياء الذين يرغبون في إعادة استخدامها ، لكن الوصول إلى البيانات لا يزال صعبًا نظرًا لضخامة حجمها وتعقيد الوصول إليها. في الآونة الأخيرة ، تم إجراء تحليل تلوي لبيانات تعبير RNA-Seq عبر مختلف الأنواع والأنسجة والدراسات 10 ومع ذلك ، فإن تفسير هذه البيانات صعب. غالبًا ما يكون علماء الأحياء في حيرة من أمرهم بسبب العدد الهائل من مجموعات البيانات في قواعد البيانات العامة التي يوفرها العديد من الباحثين. من مثل هذه المواقف ، هناك حاجة إلى مجموعات بيانات التعبير المرجعي لاستدلال وظائف الجينات ، ومن الضروري وجود واجهة ويب مناسبة لتصور هذه البيانات.

بالإضافة إلى ذلك ، يمكن للأنماط المنسقة لمحات التعبير الجيني لطرق القياس الكمي المختلفة أن تعزز الأدلة على هذه الأنماط. أيضًا ، يمكن أن يكون التعبير الخاص بالأنسجة ميزة أساسية لفحص وظيفة الجينات ذات الأهمية ، ويمكن لقوائم الجينات ذات التعبير الخاص بالأنسجة أن تساعد علماء الأحياء على استكشاف الجينات غير الموصوفة بأنماط تعبير بارزة. وبالتالي ، فإن الشرح الوظيفي للجينات من التحليل التلوي والواجهة للوصول إلى البيانات مع التصور الرسومي مطلوبة بشكل عاجل.

لقد طورنا أداة ويب لتصفح التعبير الجيني المرجعي ، والتي توفر الوصول إلى البيانات المنسقة من عدة قواعد بيانات عامة أخرى ، مع مستويات التعبير في أربعين أنسجة مقاسة بأربع تقنيات راسخة لتقدير التعبير الجيني. تتيح واجهة الويب للمستخدمين تصفح ملفات تعريف التعبير حسب اسم الجين أو أنواع مختلفة من المعرفات أو مناطق الكروموسومات في الخرائط الجينية أو عائلة الجينات استنادًا إلى InterPro 11 أو أنماط التعبير الجيني أو الفئات البيولوجية استنادًا إلى Gene Ontology 12. تسمح واجهة الويب ، المسماة مجموعة بيانات التعبير المرجعي (RefEx) ، للمستخدمين بمقارنة ملفات تعريف التعبير بطرق مختلفة في لمحة (http://refex.dbcls.jp/).


2.3 مواقع مرايا إنسيمبل

لتحسين الأداء ، توفر Ensembl عدة مرايا لموقعها موزعة في جميع أنحاء العالم. عند استخدام الإعدادات الافتراضية لـ useEnsembl () ، سيتم توجيه استفساراتك إلى أقرب مرآة لك جغرافيًا. من الناحية النظرية ، يجب أن يمنحك هذا أفضل أداء ، ولكن هذا ليس هو الحال دائمًا في الممارسة العملية. على سبيل المثال ، إذا كانت أقرب مرآة تواجه العديد من الاستعلامات من مستخدمين آخرين ، فقد يكون أداؤها ضعيفًا بالنسبة لك. يمكنك استخدام وسيطة النسخ المتطابقة لـ useEnsembl () لطلب نسخة متطابقة معينة بشكل صريح.

قيم حجة المرآة هي: useast و uswest و asia و www.


مناقشة

تم تطوير أداتنا الجديدة ، MAdb ، لتحسين التعليق التوضيحي الوظيفي لمجموعات الجينات ، التي تتكون أساسًا من DEGs أو البروتينات ، للكائنات ذات الشرح الجينومي غير المكتمل بناءً على استبدال معرف الجين الأصلي للأنواع بمعرف الجينات المتعامدة البشرية المقابلة. علاوة على ذلك ، كانت هناك حاجة إلى أداة للحصول على أزواج الجينات المتعامدة لإجراء مقارنات عبر الأنواع لمجموعات بيانات التعبير الجيني. فيما يتعلق بالتعليق التوضيحي الوظيفي لقوائم DEGs ، فقد تبين أن على سبيل المثال التعليقات التوضيحية القديمة لوظيفة الجينات لها تأثير هائل على نتائج تحليل إثراء المسار وعلم الجينات (59). وبالمثل ، فإن التخصيص غير الكامل للجينات للفئات الوظيفية والمسارات الجزيئية ، كما هو الحال بالنسبة للعديد من الماشية والحيوانات الأخرى ، يؤدي إلى فقدان كبير للمعلومات ويقلل بشكل كبير من اكتساب المعرفة من دراسات التعبير الجيني والبروتيني. أبرزت الأمثلة المقدمة مزايا نهجنا والأداء الجيد مقارنة بالأدوات أو قواعد البيانات الأخرى.

أحد التطبيقات المركزية لأداة MAdb هو مطابقة المعرف المستند إلى الموضع (AOR) بين معرفات الجينات NCBI ومعرفات الجينات Ensembl للعمل بشكل مستقل في قاعدة البيانات (NCBI أو Ensembl) مع معلومات الجينات المتعامدة. إن التخصيص الأكثر حساسية ودقة لمعرفات الجينات مقارنة بالنهج الأخرى يمنع الإيجابيات الكاذبة في تحليل متابعة المصب ويسمح باستخدام معلومات تقويم العظام المستمدة من قواعد بيانات مختلفة. تم نشر طريقة مماثلة للانضمام إلى الشرح الجيني وتعيينه من مصادر مختلفة مؤخرًا لجينوم الفأر (60). من خلال الإستراتيجية المستخدمة في أداتنا المقدمة (AOR) ، يمكننا العثور على عدد أكبر من أزواج المعرفات بين NCBI و Ensembl مقارنة بأزواج المعرفات المقدمة من NCBI و Ensembl ، على التوالي. من المحتمل أن تكون أزواج المعرفات الإضافية مشتقة من النهج الأكثر حساسية القائم على الموضع مقارنة بنهج NCBI الصارم للغاية. يمكننا أيضًا أن نظهر أن عددًا كبيرًا من أزواج المعرفات الجديدة بها تداخل جيني يتراوح بين 90٪ و 100٪ ولكن تداخل منخفض نسبيًا على exon أو CDS نظرًا لعدم وجود exons أو CDS مشروحة في واحد على الأقل من ملفات التعليقات التوضيحية (GFF أو GTF). بالإضافة إلى ذلك ، يمكننا زيادة عدد أزواج المعرفات مع الأزواج التي تتداخل بشكل كبير على مستوى exon أو CDS. تم تصميم استراتيجيتنا بشكل خاص لتقليل الإيجابيات الخاطئة ، أي أن AOR لا يتطابق مع معرفات NCBI و Ensembl للجينات الموجودة في مواقع مختلفة من الجينوم. هذا هو الحال غالبًا في قواعد البيانات الأخرى إذا أظهرت الجينات المقابلة تشابهًا كبيرًا. وجدت طرق أخرى أيضًا أزواج معرفات من الجينات غير موجودة في ملفات التعليقات التوضيحية الحالية لـ GTF / GFF. ومع ذلك ، نظرًا لأن ملفات GFF / GTF المستخدمة في MAdb مهمة فقط لتعيين معرفات الجينات NCBI و Ensembl اللازمة لاستخراج البيانات من Ensembl Compara ، فإن الجينات التي لم يتم شرحها في مجموعة الجينوم الحالية ولكن موجودة في Entrez Gene يمكن أن تظل كذلك المخصصة للجينات المتعامدة المقابلة عبر الخطوتين الأخريين لخط الأنابيب.

على الرغم من أنه يبدو من السهل مطابقة التعليق التوضيحي الجيني لنفس مجموعة الجينوم المستمدة من خطوط أنابيب التعليقات التوضيحية المختلفة ، فإن التحديات تكمن في التفاصيل. اعتمادًا على الأنواع وعلى سبيل المثال توفر النصوص الكاملة المتسلسلة ، يمكن أن يختلف التعليق التوضيحي الجيني بشكل كبير فيما يتعلق بعدد وحجم exons بين مصادر التعليقات التوضيحية المختلفة. على سبيل المثال ، يعتبر الجين جينًا واحدًا في مصدر تعليق توضيحي واحد ولكن في نفس المكان يتم شرح جينين أو أكثر في المصدر الآخر. علاوة على ذلك ، يقترح أحد المصادر 5 ′ أو 3 exon إضافية مفصولة بإنترون كبير مقارنة بالمصدر الآخر. في هذه الحالة ، يكون التداخل الجيني بين مصادر التعليق التوضيحي منخفضًا نسبيًا ولكن تداخل exon و / أو CDS لا يزال مرتفعًا بما يكفي لمطابقة الجينات. نظرًا لوجود بعض معرفات Entrez Gene الزائدة عن الحاجة في ملفات التعليقات التوضيحية NCBI (حالات نادرة ، تأتي من "مواقع بديلة" NT_ و NW_) ، فمن الضروري أيضًا تصفية ملفات GFF على كروموسومات محددة للحصول على معرفات فريدة ومواضع كروموسومية مقابلة. مثال آخر إشكالي هو الجينات التي تشترك في العديد من exons ، مثل مجموعة بروتوكادهيرين جاما. لحل هذه المشكلة ، تم تطبيق مرشح مكرر لاسترداد أفضل نتيجة فقط. يمكن العثور على عدد من الحالات الصعبة الأخرى في البيانات التكميلية (ملف إضافي 1: الأشكال S1 و S2 ، S4 - S12).

التطبيق الرئيسي لـ MAdb ، استخدام معرفات تقويم العظام البشرية المقابلة كبديل لمعرف الجين الأصلي للأنواع في تحليل التعليقات التوضيحية الوظيفية ، كشف عن فئات وظيفية أكثر إثراءً بشكل كبير لأنه تم تخصيص المزيد من الجينات للفئات الفردية الممثلة تمثيلاً زائداً. يؤدي استخدام معرفات جينات الأنواع الأصلية إلى تقليل نتائج تحليل التعليقات التوضيحية الوظيفية بشكل كبير من خلال فقدان الفئات الوظيفية والمسارات الممثلة بشكل زائد الموجودة في مجموعة البيانات التي تم تحليلها. علاوة على ذلك ، باستخدام معرفات الجينات الأصلية ، لا يمكن تعيين جميع DEGs المحددة التي تنتمي بالفعل إلى فئة وظيفية معينة. يتعلق هذا بمشكلة الجينات ذات الرموز المؤقتة مثل على سبيل المثال LOC100127131 في الأنواع مثل الخنزير. في هذه الحالات ، يتم فقدان مثل هذه الجينات عند إجراء تحليل أعمق للفئات أو المسارات الوظيفية التي تم الحصول عليها بشكل زائد.

المبادرات جارية لتوليد بيانات للتعليق التوضيحي الوظيفي للجينومات الحيوانية ، مثل GO-FAANG (61) ، في حين أن معظم المعلومات حول وظائف الجينات والبروتينات الموجودة في قواعد البيانات المعنية مستمدة من الدراسات في كائنات النموذج الكلاسيكي. يعتمد تخصيص الجينات المشروحة في الكائنات الحية المحلية وغير النموذجية إلى قاعدة بيانات علم الوجود الجيني والمسارات الجزيئية مثل مسارات KEGG (62) أساسًا على افتراض أن الجينات المتعامدة لها وظائف متشابهة في الأنواع المختلفة. بالإضافة إلى الجينات الموجودة في العديد من أنواع الثدييات ، هناك جينات خاصة بالأنواع أو مجموعة محددة يمكن أن تضيع باستخدام نهجنا. ومع ذلك ، فإن العديد من هذه الجينات ذات وظيفة غير معروفة ، وبالتالي لا تؤثر على نتائج تحليل التعليقات التوضيحية الوظيفية. نظرًا لأن الخطوتين 2 و 3 من نهج MAdb يمكن أن تقدم أيضًا نظائر أو جينات لها تشابه متوسط ​​في التسلسل في حالة عدم وجود أخصائي تقويم العظام ، يمكن على الأقل تخصيص بعض هذه الجينات لجين قد يكون له وظيفة مماثلة. علاوة على ذلك ، في حالة قاعدة بيانات Gene Ontology ، باستثناء الفئات الوظيفية المحددة للغاية ، عادةً ما يتم تخصيص الجينات ذات الصلة لنفس الفئات. هناك مشكلة أخرى في استخدام معلومات تقويم العظام وهي مضاعفات الجينات الخاصة بالأنواع ، على سبيل المثال ذات الصلة بالتكيفات مع البيئة أو التفاعلات بين المضيف والممرض التي تم العثور عليها للحيوانات الأليفة (63). هذه الجينات ، إذا تم التعبير عنها بشكل مختلف في النموذج التجريبي ، فهي ممثلة تمثيلا ناقصا في الفئة الوظيفية المقابلة أو المسار. نظرًا لأن العديد من هذه الجينات المكررة لا تحتوي حتى الآن على رمز جيني رسمي ، فلا يتم تخصيصها لقواعد البيانات الوظيفية ولا يحدث فرقًا إذا تم استخدام معرف الجين الأصلي للأنواع أو المعرف البشري المقابل.

أظهرت مقارنة MAdb بقواعد بيانات تقويم العظام المماثلة أداءً أفضل أو مشابهًا في حالة Ensembl Compara. قدمت جميع مصادر قواعد البيانات الأخرى عددًا أقل من أزواج المعرفات أو حتى تعيينات خاطئة. الأسباب مختلفة بشكل رئيسي ، مصادر بيانات أصغر (غير كاملة) أو أقل حداثة. في حالة NCBI gene2ensembl ، فإن تصفية التعليقات التوضيحية الجينية المتداخلة تكون أكثر صرامة (45). تستخدم Ensembl أربع استراتيجيات لرسم الخرائط ، والتي تستند إلى مصممي خرائط معرفات الجهات الخارجية ، وتداخلات المواقع ، ولكن أيضًا المطابقات المتسلسلة والمحاذاة باستخدام exonerate (64 ، 65). نقطة أخرى مهمة هي أن Ensembl لا تستخدم سوى جزء بسيط (أي RNAs المرسل المشروح يدويًا والبروتينات) من قاعدة بيانات NCBI Refseq (66). قد يفسر هذا سبب نتائج نهجنا في المزيد من أزواج الهوية. باستخدام OMABrowser ، وجدنا فقط جزءًا بسيطًا من أطباء تقويم العظام البشريين المعروفين ، بسبب تعيين معرف OMABrowser (معرف الجين Ensembl إلى Entrez Gene ID) (التواصل الشخصي مع مؤلفي OMABrowser). في بعض الحالات (على سبيل المثال Entrez Gene ID: 100621538 ، هيستون H2A النوع 3) وجدنا تخصيصًا للعديد من أخصائيي تقويم العظام المحتملين لجين هيستون خنزير واحد فقط. قد يكون هذا بسبب فقدان معلومات الشرح في جينوم الخنازير للعديد من جينات الهيستون المتشابهة جدًا ولكن يجب التعامل معها بواسطة مرشحات قاعدة بيانات تقويم العظام. من خلال عدم تصفية أخصائيي تقويم العظام هؤلاء ، يكون التعليق التوضيحي الوظيفي متحيزًا بشدة. يعتمد OMABrowser على Ensembl ويعتمد تعيين المعرف أيضًا على Uniprot. ومع ذلك ، عند البدء من معرفات الجينات Ensembl ، كانت نتائج DAVID التي تم الحصول عليها قابلة للمقارنة مع MAdb. إن استخدام مخطط المعرف AOR الخاص بنا لتحويل معرفات Entrez Gene إلى معرفات جينات Ensembl ثم استرداد الإنسان باستخدام متصفح OMAB قد وصل إلى نتائج MAdb. على الرغم من أن MAdb كشفت عن المزيد من المطابقات المعرفية ، إلا أن نتائج التعليقات التوضيحية الوظيفية كانت مشابهة لـ Ensembl. ومع ذلك ، كشف تحليل مطابقة معرف الجين بين Ensembl و NCBI عددًا كبيرًا من التعيينات الخاطئة في قاعدة بيانات Ensembl تشير إلى عدة مرات في النتائج بسبب التخصيصات الفردية لـ Ensembl لجينات NCBI. عند البدء من معرفات الجينات NCBI ، ستؤثر التخصيصات الخاطئة في Ensembl على النتائج في خطوتين ، أولاً مع تحويل معرف NCBI الأصلي إلى معرف Ensembl وتحويل معرف الجين التقويمي الجماعي ، على سبيل المثال الإنسان ، عودة إلى معرف الجين التقويمي NCBI. في المقابل ، فإن عدد التخصيصات الخاطئة في MAdb منخفض جدًا ولا يحدث فرقًا إذا بدأ التحليل من معرفات الجينات NCBI أو Ensembl. عادة ما تكون التخصيصات غير الصحيحة بين معرفات الجينات Ensembl والمراجع الخارجية مثل معرفات الجينات NCBI بين الجينات ذات التشابه العالي في التسلسل. لذلك ، لا يؤثر هذا بشكل كبير على نتائج تحليل التعليقات التوضيحية الوظيفية عند استخدام معرفات الجينات NCBI التي تمت ترجمتها من معرفات جينات Ensembl بناءً على المعلومات حول المراجع الخارجية في Ensembl. ولكن إذا تم تخصيص أكثر من معرف جيني NCBI واحد لمعرف جين Ensembl ، فإن النتائج تكون متحيزة. علاوة على ذلك ، قد يكون التحليل الأعمق للجينات الموجودة في الفئات الوظيفية المفرطة التمثيل مضللاً إذا كان معرف الجين NCBI لا يتوافق مع جين Ensembl الصحيح.

بشكل عام ، على الرغم من أنه يبدو من السهل تعيين معرفات جينات تقويم العظام من أجل إجراء تحليل توضيحي وظيفي محسّن واستخدام معلومات تقويم العظام من مصادر مختلفة للتعليقات التوضيحية ، أظهر هذا النهج تعقيدًا غير متوقع. أولاً ، موضوع تقويم الجينات معقد للغاية (67-69). بالنسبة للعديد من الجينات ، لا يوجد فقط أخصائي تقويم تقويمي واحد لواحد بين أنواع الثدييات ولكن يوجد أيضًا عدد كبير من الجينات الخاصة بنوع ما أو فرع خاص من الثدييات. ينتج عن وجود الجينات المكررة أو المعطلة على الجانب الآخر عددًا من المشكلات لتعيين الجينات المتعامدة ويؤثر على تحليلات التمثيل الزائد اللاحقة للفئات الوظيفية والمسارات الجزيئية بطرق متعددة. علاوة على ذلك ، يعتمد نقل الشرح الوظيفي بين الأنواع على الوظائف المحفوظة للجينات المتعامدة ، وهذا ليس هو الحال دائمًا (67). كشف استخدام المعلومات من مصادر الشرح المختلفة أيضًا عن عدد من المشكلات فيما يتعلق بالتخصيص الصحيح للجينات المشروحة بين خط أنابيب التعليقات التوضيحية NCBI و Ensembl.حتى بالنسبة للجينوم البشري الذي تم نشره لأول مرة في عام 2003 (70 ، 71) حيث تم تنفيذ مشاريع كبيرة لتسلسل الحمض النووي التكميلي بالطول الكامل لتحليل جميع الأنسجة البشرية تقريبًا لتغطية أشكال نصية محددة ، لا يوجد سوى اتفاق ضئيل حول شرح الجين فيما يتعلق بمختلف الأشكال. النسخ الإسوية وتسلسلات exon البديلة بين NCBI و Ensembl (72). إذا كان تخصيص الجينات المقابلة بين مصدري التعليقات التوضيحية غير مكتمل أو يحتوي على أخطاء ، فستفقد المعلومات أو تكون معلومات خاطئة ، على سبيل المثال حول علاقات تقويم العظام ، يمكن الحصول عليها.


بيانات الجينات NCBI

في بعض الأحيان نرغب في الحصول على جميع المعلومات على الأقراص المحلية واستخدام البرامج النصية الداخلية لإجراء التحويل. يوفر ftp://ftp.ncbi.nih.gov/gene/DATA أحدث المجموعات الشاملة من المعلومات التي تتمحور حول الجينات.

من خلال دمج البيانات من LocusLink في قاعدة بيانات Entrez مع البيانات الخاصة بالجينات من الأنواع الأخرى ، لديك الآن نقطة واحدة للبحث عن المعلومات الخاصة بالجينات الخاصة بالتصنيفات ضمن نطاق مشروع RefSeq. لديك أيضًا وصول فوري إلى البيانات ذات الصلة التي كان من الصعب الحفاظ عليها بشكل مستقل عن Entrez ، ويمكنك الاستفادة من قوة الأدوات المستندة إلى Entrez مثل Entrez Programming Utilities (E-Utilities) و MyNCBI. عبر: https://www.ncbi.nlm.nih.gov/entrez/query/static/help/LL2G.html#files

هذا README يوزع جميع الملفات المضمنة. هنا ملخص قصير.

اسم ملف Entrez Gene تعليقات
البيانات / ASN_BINARY تحتوي الملفات الموجودة في هذا الدليل على عمليات استخلاص شاملة من Entrez Gene بتنسيق ASN.1.
البيانات / GENE_INFO عمليات الاستخراج من Entrez Gene بنفس تنسيق ملف gene_info. يحتوي كل ملف على مجموعة فرعية من البيانات للأنواع أو المجموعة التصنيفية المشار إليها بواسطة اسم الملف.
البيانات / التعبير تقارير عن مستويات تعبير RNA طبيعية محسوبة من بيانات RNA-seq لجينات الإنسان والفأر والجرذان.
الحصول على الجينات تقرير شامل عن عمليات الانضمام التي ترتبط بـ GeneID. يتضمن تسلسلات من التعاون الدولي في التسلسل ، Swiss-Prot ، و RefSeq. مجموعة RefSeq الفرعية لهذا الملف متاحة أيضًا كمرجع gene2refseq… إذا كنت تريد تحويل أي مدخلات إلى GeneIDs ، فيجب أن يكون هذا الملف كافياً.
gene2ensembl تقارير هذا الملف تتطابق بين NCBI و Ensembl الشرح التوضيحي بناءً على مقارنة ميزات rna والبروتين.
gene2vega تقارير هذا الملف تتطابق بين التعليق التوضيحي لـ NCBI و Vega.
gene2go GeneID / GO ID / Evidence Code. ملخص موحد يعتمد على ملفات الارتباط الجيني من GO Consortium و Entrez Gene's gene_info file.
gene2pubmed يتضمن gene2pubmed معرفًا لأنواع GeneID (أي معرف التصنيف).
الجين 2 Refseq هذا الملف هو مجموعة RefSeq الفرعية من الوصول إلى الجينات. لا يتضمن الملف الموجود في Entrez Gene معلومات حول المدخلات الثانوية. هذه الوظيفة متوفرة الآن من موقع RefSeq ftp ، كما هو موثق في ملاحظات الإصدار الحالي: ftp://ftp.ncbi.nlm.nih.gov/refseq/release/release-notes/RefSeq-release#.txt ، حيث # هي قيمة رقم الإصدار الحالي.
الجينات علاقة معرف علامة GeneID / UniSTS
جين 2 أونيجين علاقة الكتلة GeneID / UniGene
مجموعة_الجينات تقرير الجينات وعلاقتها بالجينات الأخرى
الجينات تقرير الجينات المتعامدة
تاريخ الجينات معلومات شاملة عن GeneIDs التي لم تعد حالية
gene_info GeneID والأسماء ومواقع الخريطة والمراجع التبادلية لقاعدة البيانات.
الجين_الجيران تقارير الجينات المجاورة لجميع الجينات الموضوعة في تسلسل جينومي معين.
gene_refseq_uniprotkb_collab تقرير عن العلاقة بين مدخلات بروتين التسلسل المرجعي NCBI ومدخلات بروتين UniProtKB
mim2gene_medgen تقرير العلاقة بين أرقام MIM (OMIM) ، GeneIDs ، والسجلات في MedGen

توفر العديد من قواعد البيانات واجهات برمجة التطبيقات للمساعدة في الوصول إلى بياناتهم ويمكن استخدام بعضها لتحويل المعرف. لكني لا أوصي باستخدام واجهات برمجة التطبيقات هذه مباشرةً إذا لم ترغب جرعة واحدة في قضاء الكثير من الوقت في هذه الوظيفة ، حيث يمكن تغييرها بمرور الوقت ويجب أن يكون المستخدمون على دراية بهيكل البيانات المقدم. تحتوي العديد من واجهات برمجة التطبيقات الشائعة الاستخدام على برامج أو حزم خارجية للوصول إليها ، ويمكنك استخدام Google للعثور عليها قبل استخدام واجهات برمجة التطبيقات.

Ensembl REST API

توفر Ensembl REST API العديد من الواجهات سهلة الاستخدام لاسترجاع المعلومات. وهناك ثلاث واجهات برمجة تطبيقات لتخطيط المعرف البيولوجي المتقاطع.

    يبحث عن رمز خارجي ويعيد جميع كائنات Ensembl المرتبطة به. يجري عمليات البحث عن معرفات Ensembl واسترجاع مراجعها الخارجية في قواعد البيانات الأخرى. يجري بحثًا بناءً على الإدخال الأساسي أو تسمية العرض لمرجع خارجي ويعيد المعلومات التي نحتفظ بها حول الإدخال.

أعتقد أن biomaRt المذكور أعلاه هو في الواقع برنامج جيد الانضغاط يتواصل مع قواعد البيانات من خلال واجهات برمجة التطبيقات.

واجهة برمجة تطبيقات KEGG

KEGG API هي واجهة برمجة تطبيقات REST-stype لمورد قاعدة بيانات KEGG.

يمكننا استخدام واجهة برمجة التطبيقات هذه عن طريق bitr_kegg في حزمة العنقودية أو حزمة KEGGREST.

Bitr_kegg

يجب أن يكون نوع المعرف (كلاهما fromType و amp toType) أحد "kegg" أو "ncbi-geneid" أو "ncbi-proteinid" أو "uniprot". "kegg" هو المعرف الأساسي المستخدم في قاعدة بيانات KEGG. مصدر بيانات KEGG كان من NCBI. القاعدة الأساسية لمعرّف "kegg" هي معرف entrezgene لأنواع حقيقيات النوى ومعرّف موقع بدائيات النوى.

العديد من أنواع بدائيات النوى ليس لديها معرف Entrezgene متاح. على سبيل المثال ، يمكننا التحقق من المعلومات الجينية لـ ece: Z5100 في http://www.genome.jp/dbget-bin/www_bget؟ece:Z5100 ، والتي تحتوي على روابط NCBI-ProteinID و UnitProt في إدخال قواعد البيانات الأخرى ، ولكن ليس NCBI -GeneID.

KEGGREST

يوفر KEGGREST واجهة عميل لخادم KEGG REST. ويمكن استخدام keggConv () لتحويل المعرفات.


شكر وتقدير

نحن ممتنون للباحثين في Centro Nacional de Investigaciones Oncológicas وغيرهم من مستخدمي هذه التطبيقات الذين قدموا لنا معلومات التغذية الراجعة التي ساعدت في العثور على الأخطاء وتحسين ميزات التطبيقات. نشكر Joaquín Dopazo لمشاركته في المراحل الأولية من IDconverter ، و Martti Tolvanen على اختبار اتساق البيانات على نطاق واسع بعناية ، و Iddo Friedberg لاختبار أداء الوقت لـ IDconverter من لا جولا ، كاليفورنيا ، الولايات المتحدة الأمريكية ، واثنين من المراجعين المجهولين للتعليق. تم توفير التمويل من قبل Fundación de Investigatión Médica Mutua Madrileña ومشروع TIC2003-09331-C02-02 التابع لوزارة التعليم والعلوم الإسبانية (MEC). يتم دعم RD-U جزئيًا بواسطة برنامج Ramón y Cajal التابع لـ MEC الإسبانية. تعمل التطبيقات على مجموعة من الأجهزة المشتراة بأموال من RTICCC من FIS الإسبانية.


كيفية استرداد قائمة أسماء الجينات الكاملة ومعرفات جينات Entrez ومعلومات الشرح الأخرى من قائمة أسماء الجينات HUGO (في R أو أي منها)؟ - مادة الاحياء

لمزيد من المعلومات حول دليل علم الصيدلة (المختصر باسم GtoPdb) راجع صفحة "حول" والأسئلة الشائعة. يستند دليل علم الصيدلة إلى المعلومات المتوفرة سابقًا بشكل منفصل في الاتحاد الدولي لقاعدة بيانات الأدوية الأساسية والسريرية (IUPHAR-DB) ودليل المستقبلات والقنوات (GRAC). تصف صفحة المساعدة هذه المصطلحات والرموز المستخدمة في قاعدة البيانات وأدوات البحث المتوفرة على موقع الويب.

المصطلحات والرموز

لمزيد من المعلومات حول المصطلحات الدوائية المذكورة ، راجع منشور NC-IUPHAR حول المصطلحات والرموز. يرجى الرجوع أيضًا إلى قسم المصطلحات في صفحة المساعدة هذه.

الدورة التعليمية

يتوفر برنامج تعليمي لاستخدام قاعدة البيانات وإرشادات حول التنقل في موقع الويب للتنزيل كملف PDF.

تم نشر مجموعة من البروتوكولات الخاصة باستخدام الموقع في المعلوماتية الحيوية بروتوكولي العملة. هذه أدلة إرشادية مفيدة مع الرسوم التوضيحية لاستخدام الميزات المختلفة:

شارمان جيه إل وآخرون. (2018) الوصول إلى الخبراء ‐ البيانات الدوائية المنسقة في دليل IUPHAR / BPS إلى الصيدلة. المعلوماتية الحيوية بروتوكولي العملة. 61: 1.34.1-1.34.46.

المناعية وعلاج الملاريا

صفحات مساعدة محددة في دليل IUPHAR لبوابة وبيانات علم الأدوية المناعي

صفحات مساعدة محددة على IUPHAR / MMV Guide to Malaria Pharmacology and data

اتصل بنا

إذا كنت ترغب في الاتصال بأي تعليقات أو أسئلة أو تقارير أخطاء أو اقتراحات ، يرجى مراسلتنا عبر البريد الإلكتروني.

كيفية الاستشهاد

يرجى الرجوع إلى هذه الصفحة للحصول على تفاصيل حول كيفية الاستشهاد بالمعلومات الواردة في دليل علم الصيدلة.

حول IUPHAR-DB و GRAC

تعتمد المعلومات الواردة في دليل علم الصيدلة على مصدرين متاحين سابقًا:

1. تم تطوير IUPHAR-DB (www.iuphar-db.org) في الفترة من 2003 إلى 2014 تحت رعاية NC-IUPHAR (الاتحاد الدولي للجنة علم الأدوية الأساسية والسريرية المعنية بتسميات المستقبلات وتصنيف الأدوية) لتوفير مورد تعليمي دقيق لـ المجتمع العلمي. تشكل هذه البيانات الصفحات المستهدفة التفصيلية على موقع GtoPdb. يعتمد على مساهمات علماء الصيدلة الخبراء الذين يتطوعون بوقتهم. يُنسب جميع المساهمين بالقرب من الجزء السفلي من صفحات قاعدة البيانات ذات الصلة. يمكن الاطلاع على قائمة المساهمين كاملة هنا.

2. دليل المستقبلات والقنوات (GRAC) المنشور في المجلة البريطانية لعلم الأدوية:

إس بي إتش ألكسندر ، ماتي ، جا بيترز. (2011) دليل المستقبلات والقنوات (GRAC) ، الطبعة الخامسة. Br. فارماكول., 164 (ملحق s1) ، 1-324.

يحل الدليل الموجز لعلم الصيدلة محل GRAC ويمثل عرضًا سريعًا كل عامين لصفحات العائلة المختصرة من دليل موقع ويب الصيدلة.

البيانات الموجودة في دليل علم الصيدلة

تم تلخيص البيانات في المقام الأول من مقالات الأدبيات الأولية المختارة ، والتي تم ربطها بـ PubMed. حيثما أمكن ، يتم ربط البيانات بقواعد البيانات الأخرى ذات الصلة للحصول على مزيد من المعلومات.

نقاط الدخول إلى البيانات إما عن طريق أدوات البحث في قاعدة البيانات (البحث السريع في أعلى كل صفحة أو أدوات "البحث المتقدم" المرتبطة من القائمة) أو من خلال تصفح قوائم الهدف والروابط. يتم تنظيم الأهداف في فئات البروتين (GPCRs والإنزيمات والقنوات الأيونية وما إلى ذلك) ثم يتم تقسيمها إلى عائلات (مثل مستقبلات الأدينوزين).

تحتوي كل صفحة عائلية على ملخص للخصائص الرئيسية والتسميات الموصى بها والروابط الرئيسية لكل هدف ، بالإضافة إلى قائمة قراءة أخرى. هذه "مختصرا" يعتبر عرض المعلومات الخاصة بكل عائلة بمثابة مقدمة مفيدة "سريعة" للعائلة ولكل هدف.

يتم توفير روابط لأهم الأهداف ل أكثر تفصيلا صفحات تتضمن مقدمة أطول للعائلة وصفحات مفصلة لكل هدف. تم تصميم الصفحات المستهدفة على صفحات IUPHAR-DB ، مع معلومات منسقة من الخبراء حول التسميات والخصائص الجينية والهيكلية والدوائية والوظيفية والفسيولوجية والسريرية.

يتم توفير الروابط أيضًا عند الاقتضاء لمزيد من المعلومات والخصائص الكيميائية لجزيئات الترابط.

تحميل البيانات والمستندات

نحن نقدم ملفات البيانات المحددة المتاحة للتنزيل على هذه الصفحة. هذه هي أكثر تنسيقات الملفات المطلوبة. قد نتمكن من تقديم تنسيقات أخرى إذا قمت بإرسال بريد إلكتروني إلينا. كما نقدم ملفات تفريغ SQL لقاعدة البيانات الكاملة. التراخيص التي تغطي إعادة استخدام البيانات سخية للغاية وتسمح بالاستخدام التجاري وغير التجاري مع الإسناد.

تهدف خدمات الويب REST وواجهة برمجة التطبيقات لدينا إلى توفير وصول برمجي إلى البيانات بتنسيق JSON (JavaScript Object Notation) ، والذي يسهل قراءته لكل من البشر وأجهزة الكمبيوتر. يتم تحديث خدمات الويب في كل إصدار لقاعدة البيانات وستنعكس أي تغييرات في بنية قاعدة البيانات في إخراج JSON. يتم توفير قائمة كاملة وأمثلة لاستخدام خدمات الويب هنا.

كما نقدم مجموعات الشرائح والملصقات بما في ذلك أ مجموعة الشرائح العامة للاستخدام العام عند إنتاج العروض التقديمية والمواد التعليمية في دليل علم الصيدلة. يمكن الوصول إلى الإصدار الحالي هنا.

مرافق البحث

يتم توفير مربع بحث سريع في الجزء العلوي من جميع الصفحات الرئيسية. للبحث عن هدف أو عائلة أو رابط ، ابدأ في كتابة الاسم في مربع الاستعلام وستبدأ وظيفة البحث في البحث عن إدخالات مطابقة في قاعدة البيانات. إذا تم العثور على أي منها ، فسيتم عرضها على شكل قائمة منسدلة. يؤدي النقر فوق اسم مطابق إلى نقلك مباشرة إلى صفحة قاعدة البيانات الخاصة به. بدلاً من ذلك ، اكتب العبارة بأكملها واضغط على "بحث في قاعدة البيانات" لإجراء بحث كامل في قاعدة البيانات.

يمكنك تقييد البحث أو إجراء أنواع مختلفة من عمليات البحث ، على سبيل المثال عن طريق معرّف قاعدة البيانات أو المرجع الأدبي أو التركيب الكيميائي باستخدام أدوات البحث المتقدمة. يمكن الوصول إليها من القائمة المنسدلة على شريط القائمة الرئيسية. تتضمن أدوات البحث المتقدم خيارات بحث مختلفة مثل تقييد عمليات البحث النصية على حقول قاعدة بيانات معينة أو أنواع هدف ، أو إجراء عمليات بحث عن طريق رقم المدخل أو التركيب الكيميائي. اعتمادًا على نوع البيانات التي ترغب في البحث عنها ، يمكنك الاختيار بين أدوات البحث المستهدفة وأدوات البحث الكيميائي.

هناك أيضًا أداة بحث في علم الأدوية ، والتي تتيح للمستخدمين تحميل مجموعات معرفات الهدف لاسترداد قائمة الروابط التي تعدل تلك الأهداف.

أدوات البحث الهدف

    البحث عن النص الهدف: إجراء عمليات البحث عن الكلمات الرئيسية لحقول قاعدة البيانات المحددة.
    1. اكتب مصطلح (مصطلحات) البحث في مربع النص.
    2. إذا تم إدخال عدة كلمات ، يجب أن تكون جميعها موجودة حتى يتم إرجاع النتيجة.
    3. حدد الحقل (الحقول) من القائمة التي ترغب في البحث فيها.
    4. لتحديد عدة حقول ، اضغط باستمرار على CTRL أثناء تحديد الحقول.
    5. للبحث في قاعدة البيانات بأكملها ، حدد "الكل" في أعلى قائمة الحقول.
    6. يمكنك اختياريًا اختيار تحديد نتائجك حسب الأنواع ونوع الهدف.
    البحث عن طريق معرف قاعدة البيانات: استرداد الأهداف عن طريق إدخال معرفات قاعدة البيانات الخارجية أو أسماء الجينات ، على سبيل المثال معرف Entrez Gene أو رمز HGNC المعتمد.
    1. اكتب أو انسخ / الصق المعرف (المعرفات) في مربع النص.
    2. بدلاً من ذلك ، قم بتحميل ملف يحتوي على قائمة المعرفات بالنقر فوق "تصفح".
    3. يمكن البحث عن معرفات متعددة عن طريق فصلها بمسافات أو علامات تبويب أو أسطر جديدة.
    4. حدد قاعدة البيانات المصدر من القائمة المنسدلة. إذا كانت المعرفات من قواعد بيانات مصدر مختلفة ، فحدد "غير معروف" في القائمة.
    5. يرجى ملاحظة أن البحث في قوائم كبيرة من المعرّفات قد يفشل ، وننصح بقصر البحث على بنية يستخدم هذا البحث خوارزمية Dotmatics Pinpoint لمطابقة هيكل مرسوم ثنائي الأبعاد / Markush ويعيد أي مركبات تحتوي على بنية الاستعلام. سمارتس يستخدم Pinpoint لمطابقة Daylight SMARTS ويعيد أي مركبات تطابق الاستعلام. تشابه يستخدم بحث التشابه معامل تانيموتو لمقارنة التشابه بين جزيء الاستعلام والجزيئات في قاعدة البيانات باستخدام تحديد بصمات الأصابع الموسعة التي تم إنشاؤها وإرجاع جميع الجزيئات فوق الحد الذي حدده المستخدم (> 70٪ أو 85٪).
      يرجى ملاحظة: إذا لم يُرجع بحث التشابه النتائج المناسبة ، فيرجى محاولة استخدام وظيفة البنية التحتية. (نحن نعمل حاليًا على تحسين بحث التشابه.) بالضبط يعرض استعلام المطابقة التامة جميع المركبات المطابقة للابتسامات الكنسية ، دون أي اعتبار للمواصفات اللولبية. يتم تحقيق ذلك من خلال مقارنة تانيموتو لبصمات الأصابع وإرجاع جميع البصمات مع تشابه 100٪. إستعمال
      1. إما: أدخل تمثيل SMILES أو SMARTS للتركيب الكيميائي في مربع النص واضغط على "Import SMILES / SMARTS" لتحميل الهيكل في المحرر.
      2. أو: ارسم التركيب الكيميائي في المحرر. يمكن استخدام الأيقونة الموجودة في أعلى يمين الذرات لإضافة ذرات أخرى ومجموعات R ومجموعات SMARTS.
      3. اختر نوع البحث المراد إجراؤه من القائمة المنسدلة في أعلى اليمين (على سبيل المثال ، التشابه - مرتفع).
      4. اختر نوع الفئة الكيميائية للبحث عنها (النوع الموصى به هو الجزيئات الصغيرة ولكن يمكنك أيضًا البحث عن الببتيدات مع توفر الابتسامات).
      5. يتم ترتيب الهياكل التي تم إرجاعها تقريبًا وفقًا لمرونتها / تعقيدها.
      6. في صفحة النتائج ، سيؤدي النقر فوق صورة أو اسم الرابط إلى نقلك إلى صفحة الارتباط الخاصة به. سيؤدي النقر فوق الزر "استخدام في البحث" إلى تحميل الرابط في المحرر بحيث يمكن تعديله إذا لزم الأمر واستخدامه في بحث إضافي.
      ملحوظات
      1. لا تأخذ وظيفة البحث حاليًا في الاعتبار المواصفات اللولبية للمركبات المتطابقة. هذا للتأكد من أنه سيتم إرجاع جميع النتائج ذات الصلة. يرجى التأكد من أن ملف لا يتضمن هيكل الإدخال المواصفات اللولبية أو النظيرية، وإلا فقد تفقد عمليات البحث المطابقة التامة والبنية التحتية و SMARTS الهياكل ذات الصلة.
      2. عمليات البحث المطابقة تمامًا والبنية التحتية و SMARTS غير قادرة حاليًا على التعرف على tautomers البديلة التي قد تكون في قاعدة البيانات. يرجى استخدام البحث عن التشابه إذا كنت تشك في حدوث ذلك.

أداة البحث الصيدلانية

    البحث الصيدلاني حسب الهدف: قم بتحميل مجموعة من معرفات الهدف (مثل مدخلات UniProtKB ومعرفات Ensembl Gene) لاسترداد قائمة الروابط المعروفة بتعديلها.
    1. اكتب أو انسخ / الصق المعرف (المعرفات) في مربع النص.
    2. بدلاً من ذلك ، قم بتحميل ملف يحتوي على قائمة المعرفات بالنقر فوق "تصفح".
    3. يمكن البحث عن معرفات متعددة عن طريق فصلها بمسافات أو علامات تبويب أو أسطر جديدة.
    4. يرجى ملاحظة أن البحث في قوائم كبيرة من المعرفات قد يفشل ، وننصح بقصر البحث على نظرة عامة - يوفر مقدمة موجزة للعائلة المستهدفة. بالنسبة للأهداف التي قد تتوفر فيها مقدمة أكثر شمولاً ، يتم توفير ارتباط للصفحة ذات الصلة.

التسمية - التسمية الموصى بها لهدف متميز هيكليًا وتشغيليًا في عائلة معينة. عندما يكون هذا هو المصطلح الموصى به المنشور في NC-IUPHAR ، يتم تحديد ذلك في قسم نظرة عامة مع مراجع للمقالات ذات الصلة في المراجعات الدوائية. في الحالات التي لا توجد فيها توصيات NC-IUPHAR منشورة ، عادة ما تكون التسمية المعتمدة واحدة من: اسم الجين المعتمد من HGNC ، وهو اسم شائع الاستخدام في الأدبيات أو توصية أولية من NC-IUPHAR.

أسماء أخرى - تفاصيل قائمة بالأسماء البديلة الموجودة في الأدبيات ، ولكنها ليست التسميات الموصى بها.

صفحة أكثر تفصيلاً - روابط تؤدي إلى صفحة الهدف الأكثر تفصيلاً.

الوحدات الفرعية - يسرد الوحدات الفرعية التي تشكل معًا البروتين المتماثل أو البروتين المتغاير.

معرفات الجينات و UniProt و Ensembl - لكل هدف ، يتم توفير رموز الجينات البشرية (Hs) والماوس (Mm) والجرذ (Rn) مع روابط إلى HUGO Gene Nomenclature Committee (HGNC) و Mouse Genome Informatics (MGI) و Rat مواقع ويب قاعدة بيانات الجينوم (RGD). كما يتم توفير روابط لقاعدة بيانات الجينوم Ensembl وقاعدة معرفة بروتين UniProt. يمكن الوصول إلى روابط قاعدة البيانات الإضافية عبر صفحات الهدف الأكثر تفصيلاً. للحصول على أوصاف قواعد البيانات المرتبطة للاطلاع على جدول ارتباطات قاعدة البيانات.

ترتيب الفعالية (أهداف معينة) - يُفصِّل ترتيب فاعلية نشاط سلسلة من الروابط في هدف معين.

بيانات تفاعل Ligand - يتم سرد تفاعلات Ligand عند الأهداف من خلال عمل ligand والانتقائية وسياق الترابط. عندما يكون الترابط داخليًا للهدف الذي تم اختباره ، يشار إلى ذلك وفقًا لذلك.أسماء الروابط هي روابط قابلة للنقر لصفحات تصف خصائص الروابط (انظر قسم صفحة الروابط). يتم اختيار الترابطات لتمثيل مجموعة من المنبهات والمضادات والمنشطات والمثبطات والمثبطات والمُنظِّمات الخيفية والتحقيقات لأهداف معينة موصى بها. حيثما أمكن ، يتم توفير ملخص للأدبيات التي تسجل نشاط الترابط.

التعليقات - تتضمن تعليقات ومعلومات إضافية حول الأسرة المستهدفة والبيانات الواردة في الجداول.

مزيد من القراءة - مجموعة مختارة من المؤلفات الأساسية حول الأسرة المستهدفة.

المراجع - قائمة أبجدية بالمراجع المذكورة في صفحات العائلة المستهدفة.

ملحوظة. تركز الصفحات العائلية الموجزة على خصائص أهداف بشرية والبيانات التي تشير إلى الأنواع الأخرى مبينة وفقا لذلك.

الصفحات المستهدفة التفصيلية

التسمية - التسمية الموصى بها لهدف متميز هيكليًا وتشغيليًا في عائلة معينة. حيثما كان ذلك مناسبًا ، يتم نشر التسمية الموصى بها NC-IUPHAR في المراجعات الدوائية. في الحالات التي لا توجد فيها توصيات NC-IUPHAR منشورة ، عادة ما تكون التسمية المعتمدة واحدة من: اسم الجين المعتمد من HGNC ، وهو اسم شائع الاستخدام في الأدبيات أو توصية أولية من NC-IUPHAR. راجع قسم الهدف ذي الصلة أدناه للحصول على مزيد من المعلومات.

رموز اللون - يتم إعطاء كل صفحة هدف ومقدمة رمز لون للإشارة إلى حالة التعليق التوضيحي:

تم شرح البيانات المشروحة والمراجعة بواسطة خبير ومراجعتها من قبل خبير. يرجى الاتصال بنا إذا كنت تستطيع المساعدة في التحديثات. مشروحة وتنتظر المراجعة تم إدخال البيانات المتاحة من قبل الخبراء أو القيمين على المعارض ولكن لم يتم مراجعتها بعد من قبل خبراء مستقلين. يرجى الاتصال بنا إذا كنت تستطيع المساعدة في المراجعة. في انتظار التعليق التوضيحي / قيد التطوير هذه الصفحات في انتظار التعليق التوضيحي. يتم عرض الحد الأدنى من البيانات حول المستقبلات ، على سبيل المثال روابط المصطلحات وقاعدة البيانات. في حين أن بعض الصفحات قيد التطوير ، لا يزال البعض الآخر بحاجة إلى متطوعين ، لذا يرجى الاتصال بنا إذا كان بإمكانك المساعدة في إضافة التعليقات التوضيحية.

معلومات الجينات والبروتينات - بالنسبة لأهداف الإنسان والفأر والجرذان ، يتم عرض البيانات التالية:

عمودي تعريف
مجالات الغشاء (TM) عدد المرات التي يمر فيها عديد الببتيد عبر غشاء الخلية.
حلقات P. (بعض القنوات الأيونية فقط) عدد حلقات المسام في البروتين.
الأحماض الأمينية (AA) عدد الأحماض الأمينية التي يتكون منها البروتين.
موقع الكروموسومات الموقع الجيني لجين الترميز.
رمز الجينات الرمز الرسمي الممنوح للجين الذي يرمز للهدف والذي ، إذا تم تمييزه باللون الأزرق ، يرتبط إما بقواعد بيانات HGNC أو MGI أو RGD.
اسم الجين الاسم الكامل للجين الذي يرمز للهدف.
المرجعي إشارة إلى الورقة (الأوراق) الأولى التي تصف استنساخ الهدف.

الأسماء السابقة وغير الرسمية - الأسماء البديلة الموجودة في الأدبيات أو قواعد البيانات الأخرى ، ولكنها ليست التسميات الموصى بها حاليًا. يتضمن أيضًا أي رموز أو أسماء جينية سابقة مستخدمة لجينات الإنسان أو الفئران أو الفئران.

روابط قواعد البيانات - يتم توفير روابط لمصادر أخرى ذات صلة ، بما في ذلك قواعد البيانات الجينية (مثل Ensembl و Entrez Gene) وقواعد بيانات البروتين (مثل RefSeq و Uniprot) وغيرها مثل ChEMBL (بيانات أدبيات MedChem حول الجزيئات الشبيهة بالعقاقير وأهدافها) و DrugBank (بيانات عن الأدوية المعتمدة والبروتينات التي تتفاعل معها). للحصول على قائمة وأوصاف كاملة ، راجع جدول ارتباطات قاعدة البيانات.

هياكل ثلاثية الأبعاد محددة - تم تحديد الهياكل ذات الدقة العالية وتم إجراء محاولة لتضمين كل هدف الهياكل المحددة غير المرتبطة بالناضد والمضاد حيثما كان ذلك متاحًا. يتم توفير روابط لربط الروابط بصفحات روابط RCSB PDB حيثما أمكن ذلك.

ليجند طبيعي / داخلي المنشأ - يجند (ليجند) داخلي أو طبيعي رئيسي للهدف.

Ligands - يتم ترتيب Ligands في جداول وفقًا لعملها على الهدف.
تم وصف عناوين الأعمدة أو الرموز في جدول الترابط أدناه:

عنوان الرمز / الجدول تعريف
يشير إلى أن الترابط هو إما جزيء عضوي صغير (اصطناعي أو يحدث بشكل طبيعي) أو منتج طبيعي (أو مشتق).
يشير إلى أن الليجند عبارة عن ببتيد (اصطناعي أو طبيعي) أو جسم مضاد.
يشير إلى أن الرابطة تمت الموافقة عليها أو تمت الموافقة عليها في الماضي للاستخدام السريري البشري من قبل وكالة تنظيمية.
يشير إلى أن الهدف يمكن اعتباره الهدف الأساسي للمركب. في بعض الحالات ، على سبيل المثال مثبطات مزدوجة ، قد يحتوي المركب على أكثر من هدف أساسي.
يشير إلى أن هناك بيانات متاحة للربط الترابطي بأهداف أخرى في قاعدة البيانات.
يؤدي النقر فوق هذا الرمز إلى عرض قائمة الأهداف وفاعلية الترابط في كل هدف.
يشير إلى أن الترابط داخلي في أنواع الهدف قيد الاختبار.
يشير إلى أنه تم تمييز الرابطة كيميائيًا مثل نظير غير مستقر أو علامة فلورية أو كيان كيميائي صغير.
يشير إلى أن الليجند مُصنَّف بنظير مشع.
يشير إلى أن الرابط يحتوي على إدخال في بنك بيانات البروتين (PDB).
يشير إلى أنه قد تم وضع علامة على الليجند في قاعدة البيانات على أنه ذو صلة بعلم الأدوية المناعي.
يشير إلى أنه قد تم وضع علامة على الرابط في قاعدة البيانات على أنه مضاد للملاريا.
يشير إلى وجود مخططات نشاط Ligand متاحة لهذا الترابط. توفر هذه تصوراً لبيانات النشاط ، عبر الأنواع ، من GtoPdb و ChEMBL (عند توفرها).
هس ، مم ، آكانيوز إلخ يشير إلى أنواع الهدف وليس أنواع الربيطة. "؟" يشير إلى أن النوع لم يتم ذكره في المنشور الأصلي. لا تظهر جداول الانتقائية عندما تكون الأنواع غير معروفة. حرك الماوس فوق الاسم المختصر لرؤية اسم الأنواع الأطول.
يجند اسم الرابط الذي يمكن النقر عليه لفتح صفحة يجند. تشتمل صفحات الروابط الترابطية على روابط قاعدة البيانات ، والأسماء البديلة ، وبيانات عن التقارب لأهداف أخرى ، ومعلومات هيكلية وروابط إلى روابط مماثلة ، حيثما كان ذلك متاحًا.
عمل يشير هذا إلى كيفية ارتباط ligand بالهدف (راجع وثيقة المصطلحات والرموز لتعريف المصطلحات).
قيمة مقياس لمدى قوة ارتباط الترابط بالهدف. في الحالات التي لا تتوفر فيها بيانات ملزمة ، يمكن استخدام البيانات الوظيفية.
معامل المعلمة المستخدمة لقياس ارتباط الترابط بالهدف (انظر وثيقة المصطلحات والرموز لتعريف المصطلحات).
نطاق التركيز في حالة عدم توفر بيانات التقارب ، يتم عرض نطاق تركيز الترابط المستخدم للدراسة (في M).
عقد الجهد الجهد الذي تم تحديد التقارب المعروض عنده (بالسيارات). تشير كلمة "فسيولوجي" إلى أن التجربة أجريت في خلايا سليمة حيث لا يمكن تحديد الجهد.

يمكن فرز الروابط بالترتيب الأبجدي أو حسب الإجراء أو التقارب أو الوحدة أو نطاق التركيز أو الضغط على الجهد من خلال النقر على رأس العمود.

بيانات الفرز - في حالة وجود بيانات فحص ليجند على نطاق واسع في قاعدة البيانات ، يتم تضمينها في جداول منفصلة. عادةً ما يتم تطبيق قيمة حدية بحيث لا يتم عرض سوى الروابط ذات الأنشطة الأقل من تركيز معين على الصفحة الهدف ويتم إعطاء ارتباط إلى المجموعة الكاملة من البيانات الخاصة بالهدف. حيث اختبرت الشاشة متغيرات متعددة للهدف ، يتم عرض بيانات المتغيرات في جداول منفصلة. وبالمثل ، في صفحات الترابط ، يتم عرض بيانات الفرز في جداول منفصلة ، مع أهداف مرتبة حسب مستوى النشاط.

الفحص الوظيفي - تفاصيل أنظمة الاختبار الدوائية (الأنسجة الكاملة أو الخلايا المعزولة) التي يمكن أن تُعزى فيها الاستجابة إلى وظيفة نوع مستقبل محدد.

توزيع الأنسجة - التوزيع المركزي والمحيطي للمستقبلات (وتقنيات التحديد).

مجموعات بيانات التعبير - عروض رسومية لمجموعات بيانات تعبيرية عالية الإنتاجية محددة.

الوظائف الفسيولوجية - الاستجابة الفسيولوجية بوساطة المستقبل إذا تم تأسيسها في الأنسجة الكاملة ، ويفضل أن تكون في الجسم الحي.

العواقب الفسيولوجية لتغيير التعبير الجيني - اختلافات فسيولوجية مهمة لوحظت نتيجة لتعديل مستويات التعبير (مثل الضربات القاضية).

بيانات الطفرات التجريبية GPCRDB - يتم توفير البيانات الخاصة بالطفرات المتولدة تجريبياً من الأدبيات لـ GPCRs بواسطة GPCRDB. تعمل GPCRDB مع اتحاد لجمع البيانات حول طفرات GPCR وتدعو إلى التقديم. وبالتالي ، سيتم تحديث بيانات الطفرة المعروضة هنا تلقائيًا كلما أصدرت GPCRDB بيانات جديدة.

الأنماط الظاهرية والأليلات ونماذج الأمراض - بيانات إضافية عن الطفرات العفوية والمستحثة والمعدلة وراثيًا وأنماطها الظاهرية الخاصة بالسلالة من Mouse Genome Informatics.

الطفرات ذات الصلة سريريًا والفيزيولوجيا المرضية - تفاصيل الفيزيولوجيا المرضية التي تشارك فيها المستقبلات ، بما في ذلك ، حيثما كان ذلك متاحًا ، الروابط الموجودة في المستقبلات ذات الاستخدام العلاجي. يتم توفير تفاصيل الطفرات الفردية التي تؤدي إلى الفيزيولوجيا المرضية ، من حيث التغيير في تسلسل الأحماض الأمينية.

التعبير الجيني والفيزيولوجيا المرضية - الفيزيولوجيا المرضية التي تنشأ من التعبير الجيني غير الطبيعي.

متغيرات المستقبل المهمة بيولوجيًا - تفاصيل تعدد الأشكال والتعديلات اللاحقة للنسخ (مثل تباين الوصلة) التي تؤثر على الوظيفة. حيثما أمكن ، يتم توفير روابط لتسلسل البروتين والنيوكليوتيدات.

ملحوظة. تُستخدم أنواع إضافية في بعض الأحيان حيث لا تتوفر بيانات عن الإنسان والجرذ والفأر ، والأكثر شيوعًا هي: Bt (بقري) ، Oc (أرنب) ، Cp (خنزير غينيا) ، Clf (كلب).

صفحات GPCR

صفحات موجزة

التسمية - أوصت NC-IUPHAR بالتسميات لمستقبل أو وحدة فرعية متميزة هيكليًا وتشغيليًا في عائلة معينة. NC-IUPHAR تنشر تسمياتها الموصى بها في المراجعات الدوائية. في الحالات التي لا يوجد فيها منشور حتى الآن ، فهذه هي التوصية الأولية من NC-IUPHAR.

التحويل الأساسي / الرئيسي - مسار أو آلية إشارات مستقبلات المبدأ المفضل ، عند إنشائها. هذه هي الآلية المستخدمة كنشاط إشارات رئيسي من أجل تنظيم الوظيفة الفسيولوجية الثابتة.

صفحات أكثر تفصيلاً

آليات النقل الثانوية - مسارات أو آليات إشارات المستقبل الثانوية ، عند إنشائها.

الترابطات - تُصنف الترابطات على أنها ناهضات أو مناهضات أو منظمات خيفية.

صفحات قناة أيون

بالنسبة لبوابة الجهد (VGIC) ، وبوابات ligand-gated (LGIC) وأنواع أخرى من القنوات الأيونية

صفحات موجزة

التسمية - أوصت NC-IUPHAR بالتسميات لمستقبل أو وحدة فرعية متميزة هيكليًا وتشغيليًا في عائلة معينة. NC-IUPHAR تنشر تسمياتها الموصى بها في المراجعات الدوائية. في الحالات التي لا يوجد فيها منشور حتى الآن ، فهذه هي التوصية الأولية من NC-IUPHAR.

بيانات تفاعل Ligand - في بعض الحالات يتم سرد تفاعلات ligand في القنوات الأيونية ضمن الوحدة الفرعية التي تمنح الخصوصية للقناة غير المتجانسة (مثل وحدات ألفا الفرعية لمستقبلات الأسيتيل كولين النيكوتين). يتم توفير معلومات داعمة إضافية مثل انتقائية الوحدة الفرعية / homomer / heteromer وسياق ligand وموقع عمل المستقبل.

الخصائص الوظيفية - يقدم تفاصيل عن خصائص التوصيل والاعتماد على الجهد والتصحيح والانتقائية للقنوات الأيونية.

صفحات أكثر تفصيلاً

البروتينات المرتبطة - البروتينات التي تتفاعل مباشرة مع المستقبل إما كوحدات فرعية مكونة للمسام غير متجانسة أو وحدات فرعية مساعدة أو بروتينات مرتبطة.

انتقائية الأيونات والتوصيل - يعرض هذا الجدول بيانات التوصيل النسبية أو المطلقة للمستقبل على أساس "لكل نوع".

الاعتماد على الجهد - (VGICs فقط) يعرض هذا الجدول الفولتية في التنشيط وإلغاء التنشيط وإلغاء التنشيط والثوابت الزمنية ذات الصلة ، حيثما كان ذلك متاحًا.

الروابط - بالنسبة إلى LGICs ، يتم تصنيف الروابط على أنها ناهضات أو مناهضات أو حاصرات قنوات أو منظمات خيفية. بالنسبة إلى VGICs ، يتم تصنيف الروابط على أنها منشطات أو حاصرات قنوات أو مثبطات بوابات ، وفقًا للتعريفات التالية:

المنشطات Ligands التي تنشط القنوات الأيونية عن طريق الارتباط بها مباشرة ، بما في ذلك الروابط التي تسبب تغييرًا في اعتماد الجهد لبوابة القناة التي تفضل التنشيط. مثبطات البوابات Ligands التي تمنع قناة الأيونات من خلال الارتباط المباشر بالقنوات ، بما في ذلك الروابط التي تمنع تنشيط القناة الأيونية وتلك التي تمنع تعطيل القناة الأيونية. روابط حاصرات القنوات التي تمنع حركة الأيونات عبر مسام القنوات الأيونية.

صفحات المستقبلات النووية

صفحات موجزة

التسمية - الاسم الأكثر استخدامًا للمستقبل.

التسمية المنهجية - أوصت لجنة تسمية المستقبلات النووية (NRNC) باسم المستقبل. انظر المرجع:
لجنة تسمية المستقبلات النووية (1999). نظام تسمية موحد لعائلة المستقبلات النووية الفائقة. زنزانة 97، 161-163. [بميد: 10219237]

صفحات أكثر تفصيلاً

الترابطات - المركبات التي ترتبط بشكل عكسي بـ NRs في جيب الربط الترابطي الطرفي C (LBP).

ناهضات الترابط التي تحفز التشكل النشط للمستقبل. Ligands المضادات التي تنتج تشكلاً وعملًا للمستقبل يختلف عن ذلك الذي ينتج عن ناهض. المنبهات العكسية Ligands التي يمكن أن تعزز توظيف corepressor. ناهضات جزئية منبهات أنه في نسيج معين ، في ظل ظروف معينة ، لا يمكن أن ينتج تأثيرًا مثاليًا (حتى عند استخدامه بتركيز عالٍ ، بحيث يجب شغل جميع المستقبلات) كما يمكن أن يعمل ناهض آخر من خلال نفس المستقبلات في نفس النسيج.

مستقبلات غير مجمعة - تعتبر مفضلة مقارنة بمستقبلات apo.

ربط الحمض النووي - عناصر الاستجابة الهرمونية (HRE) هي مواقع التعرف على الحمض النووي التي تتضمن مواقع نصف متكررة مقلوبة للحمض النووي وتكرارات مباشرة (مثل DR1-DR5) للمستقبلات المتجانسة وغير المتجانسة على التوالي.

شركاء الارتباط المشترك - البروتينات التي تتفاعل على وجه التحديد مع NRs وتحدث تأثيرًا وظيفيًا معها.

المنظمون المساعدون - الجزيئات الكبيرة التي ترتبط مع NRs لتعديل نشاط النسخ الخاص بها القابل للقسمة إلى عوامل تنظيمية تعزز النشاط الإيجابي (العوامل المُنشطة) وتلك التي تعزز النشاط السلبي (عوامل الضغط).

الجينات المستهدفة الرئيسية - الجينات المنظمة مباشرة من خلال إجراءات NRs.

Transactivity - تنشيط النسخ بربط عامل النسخ (والقائمين بالتنظيم) بالتسلسل التنظيمي للحمض النووي.

الأشكال الإسوية - منتجات نفس الجين التي يتم إنتاجها عن طريق التضفير البديل ، واستخدام المروج البديل ، والبدء الترجمي البديل لا يأخذ في الاعتبار أمثلة التعديلات اللاحقة للترجمة: RAR & alpha1 و RAR & alpha2.

تم تكييف المصطلحات والتعريفات من خلاصة IUPHAR.

صفحات المستقبلات الحفازة

صفحات موجزة

التسمية - المصطلحات المستخدمة هنا إما موصى بها من قبل لجنة التسمية التابعة للاتحاد الدولي للكيمياء الحيوية والبيولوجيا الجزيئية (NC-IUBMB) (استنادًا إلى نظام رقم لجنة الإنزيم (EC)) ، أو الاسم المعتمد من HGNC أو يعتمد على التسمية شائع الاستخدام في الأدب.

الاسم المختصر - اسم مختصر شائع الاستخدام في الأدبيات.

الاسم المنهجي - اسم منهجي يستخدمه HGNC أو في الأدبيات.

الترابط الداخلي المنشأ - الروابط التي تنشأ من داخل الكائن المدروس والتي تبين أن لها نشاطًا في المستقبل.

بروتينات المهايئ - البروتينات القائمة على السيتوبلازم والتي تحتوي على وحدات ربط بروتين تشارك في إشارات المستقبلات التحفيزية.

رقم EC - انظر أدناه وصف الإنزيمات.

صفحات الإنزيم

صفحات موجزة

التسمية - المصطلحات المستخدمة هنا إما موصى بها من قبل لجنة التسمية التابعة للاتحاد الدولي للكيمياء الحيوية والبيولوجيا الجزيئية (NC-IUBMB) (استنادًا إلى نظام رقم لجنة الإنزيم (EC)) ، وهو الاسم المعتمد من HGNC أو يعتمد على التسمية شائع الاستخدام في الأدب.

الاختصار الشائع - عادةً ما يكون الاختصار الأكثر استخدامًا لاسم الإنزيم كما هو مستخدم في الأدبيات ليس بالضرورة الاختصار المفضل.

رقم EC - رقم لجنة الإنزيم (EC) هو نظام تصنيف قائم على العددي للإنزيم بناءً على التفاعل الذي يحفزه. يتكون كل رقم EC من رمز مكون من أربعة أرقام ، مع الرقم الأول الذي يصف واحدة من 6 وظائف إنزيم عامة محتملة: الأكسدة ، أو الترانسالات ، أو الإنزيمات المائية ، أو الليزازات ، أو الأيزوميرات ، أو الليجازات ، مع استخدام الأرقام المتبقية كمصنف دقيق بشكل متزايد لتفاعل الإنزيم . نظرًا لأن أرقام EC تصف وظيفة الإنزيم ، فإن رقم EC ليس بالضرورة فريدًا بالنسبة إلى إنزيم معين ، أي يمكن تخصيص رقم EC لأكثر من إنزيم ، ويمكن تعيين إنزيم به أكثر من وظيفة واحدة عدة أرقام E.C.

الركيزة / الركيزة الداخلية - المادة التي يرتبط بها إنزيم معين ويتحول إلى المنتج. تنشأ الركيزة الداخلية من الكائن الحي الذي يتم فيه دراسة الإنزيم المحدد ، بينما تشتمل الركائز الاصطناعية على أدوية وعوامل كيميائية أخرى غير طبيعية.

المنتج - المادة الناتجة عن تحويل الركيزة بواسطة إنزيم.

المانع / المانع الداخلي - مادة تقلل أو تمنع نشاط الإنزيم ، عادة عن طريق الارتباط بالإنزيم. قد تكون مثبطات الإنزيم قابلة للعكس أو لا رجعة فيها ، والمثبطات العكوسة تنافسية أو غير تنافسية. تنشأ المثبطات الذاتية من داخل الكائن الحي الذي يتم فيه دراسة الإنزيم ، بينما تشتمل المثبطات الاصطناعية على عقاقير وعوامل كيميائية أخرى غير طبيعية.

المنشط / المنشط الداخلي - مادة تزيد من نشاط الإنزيم بعد الارتباط بالإنزيم.

العامل المساعد - مادة كيميائية ترتبط بالإنزيم وهي ضرورية لنشاطها. العوامل المساعدة ليست ببتيدات ، ويمكن أن تكون مركبات عضوية أو غير عضوية.

صفحات أكثر تفصيلاً

كم - يحدد ثابت Michaelis (Km) تركيز الركيزة عندما يكون معدل التفاعل نصف Vالأعلى.

الخامسالأعلى - أقصى معدل للتفاعل ، أو السرعة القصوى التي وصل إليها النظام في ظل ظروف أقصى تركيز (تشبع) من الركيزة.

صفحات الناقل

التسمية - الاسم الأكثر استخدامًا للناقل.

التسمية المنهجية - الاسم الموصى به للناقل كما هو موضح أصلاً في سلسلة من المراجعات المنشورة في المحفوظات Pfl & uumlgers 447، العدد 5 ، فبراير 2004. [PMID: 14624363]

الاختصارات الشائعة - الاختصارات المستخدمة بشكل شائع للناقل الموجودة في الأدبيات.

الأسماء الأخرى - الأسماء البديلة الموجودة في الأدبيات ، ولكنها ليست التسميات الموصى بها.

ركائز / ركائز داخلية - تفاصيل قائمة بالمواد التي يتم نقلها. عندما تكون الركيزة داخلية لناقل معين ، يشار إلى ذلك وفقًا لذلك. أسماء الركائز هي روابط قابلة للنقر لصفحات تصف خصائص الركيزة.

مثبطات / مثبطات انتقائية - مثبطات قدرة الناقل على نقل ركائز عبر الغشاء. عندما يكون المانع انتقائيًا لناقل معين ، تتم الإشارة إلى ذلك وفقًا لذلك. أسماء المانع هي روابط قابلة للنقر لصفحات تصف خصائص المانع.

الخصائص الوظيفية - يوفر تفاصيل عن خصائص الموصلية والجهد والاعتماد على الوقت للناقلات.

قياس العناصر المتكافئة / قياس العناصر المتكافئة المتوقعة - يوفر تفاصيل عن القياس المتكافئ للركيزة المقاسة تجريبياً أو المتوقع قياسها للناقل جنبًا إلى جنب مع اتجاه انتقال الركيزة عبر الغشاء.

صفحات يجند

المرادفات - الأسماء البديلة الموجودة في الأدبيات ، والتي قد تتضمن أسماء منهجية.

عنوان الرمز / الجدول تعريف
يشير إلى أن الترابط هو إما جزيء عضوي صغير (اصطناعي أو يحدث بشكل طبيعي) أو منتج طبيعي (أو مشتق).
يشير إلى أن الليجند عبارة عن ببتيد (اصطناعي أو طبيعي) أو جسم مضاد.
يشير إلى أن الرابطة تمت الموافقة عليها أو تمت الموافقة عليها في الماضي للاستخدام السريري البشري من قبل وكالة تنظيمية.
يشير إلى أنه تم تمييز الرابطة كيميائيًا مثل نظير غير مستقر أو علامة فلورية أو كيان كيميائي صغير.
يشير إلى أن الليجند مُصنَّف بنظير مشع.
يشير إلى أن الرابط يحتوي على إدخال في بنك بيانات البروتين (PDB).
يشير إلى أنه قد تم وضع علامة على الليجند في قاعدة البيانات على أنه ذو صلة بعلم الأدوية المناعي.
يشير إلى أنه قد تم وضع علامة على الرابط في قاعدة البيانات على أنه مضاد للملاريا.
يشير إلى وجود مخططات نشاط Ligand متاحة لهذا الترابط. توفر هذه تصوراً لبيانات النشاط ، عبر الأنواع ، من GtoPdb و ChEMBL (عند توفرها).

الدواء المعتمد - يشير إلى المواد الفعالة في علم العقاقير ، المحددة بواسطة الأسماء الدولية غير المسجلة الملكية الخاصة بهم ، والتي تمت الموافقة عليها للاستخدام السريري من قبل وكالة تنظيمية ، عادةً إدارة الغذاء والدواء الأمريكية أو وكالة الأدوية الأوروبية أو في اليابان. يستمر هذا التصنيف بغض النظر عما إذا كان قد تم سحب الدواء أو إيقافه لاحقًا. (ملحوظة: في بعض الحالات ، تم الحصول على المعلومات المتعلقة بحالة الموافقة بشكل غير مباشر من خلال قواعد البيانات مثل Drugbank.)

تصنيف Ligand - يتم تخصيص المركبات للفئات العامة بناءً على أصلها وخصائصها الهيكلية. راجع المسرد للحصول على قائمة بالفئات والتعريفات.

مخططات نشاط يجند

توفر هذه الأداة مخططات مع مخططات مربعة تلخص جميع بيانات النشاط لرابطة مأخوذة من ChEMBL و GtoPdb عبر أهداف وأنواع متعددة. انقر فوق قطعة الأرض لرؤية متوسط ​​، والمدى الربيعي ، ونقاط البيانات المنخفضة والعالية. تشير القيمة صفر إلى عدم توفر أي بيانات. يتم إنشاء مخطط منفصل لكل هدف ، وحيثما أمكن ، تحاول الخوارزمية دمج أهداف ChEMBL و GtoPdb عن طريق مطابقتها على الاسم وانضمام UniProt ، لكل نوع متاح. ومع ذلك ، يرجى ملاحظة أن عدم الاتساق في تسمية الأهداف قد يؤدي إلى الإبلاغ عن البيانات لنفس الهدف عبر مخططات متعددة.

تصفية بيانات ChEMBL - يتم استخراج بيانات النشاط من ChEMBL 27 * وفقًا للقواعد التالية:

  1. يجب أن يحتوي الهدف على نوع من "البروتين الفردي" أو "مجمع البروتين" أو "مجموعة البروتين المركب"
  2. يتم دمج أنواع التقارب وتوحيدها على النحو التالي:
    كد = ثابت التفكك ، Kd ، K app ، K Bind ، K calc ، Kd '، KD app ، KD' ، Kd (app) ، KD50 ، Kdiss ، نسبي Kd ، ثابت الربط ، K aff ، K diss ، KD / Ki
    pKد = -Log Kdiss، -Log KD50، pKd، pKD، logKd، -Log Kd، Log Kd، -Log KD، Log KD
    كأنا = Ki ، Ki ، ki ، Ki المُعدَّل (غير فاعل) ، تطبيق Ki ، Ki (التطبيق) ، Ki_app ، Ki '، Ki' ، KI '، K'i ، Kiact ، Ki high ، Ki low ، KiH ، KiL ، Kii و KII و Kic و Ki.c و Ki comp و Ki 'uncomp
    pKأنا = pKi (التطبيق) ، pKi ، -Log K0.5 ، Log Ki ، logKi ، -Log Ki ، pKiH ، pKiL
    IC50 = تطبيق IC50 ، IC50 ، IC50 كحد أقصى ، I50 ، متوسط ​​IC50 ، IC50H ، IC50L
    صورة50 = pIC50، pIC50 (التطبيق)، -Log I50، logIC50، log IC50، Log IC50، -Log IC50، pI50، pIC50 (احسب)
    EC50 = EC50
    بيك50 = pEC50 dis ، pEC50 ، -Log EC50 ، Log EC50 ، logEC50
    أ2 = A2
    pA2 = pA2 ، pA2 (التطبيق) ، تطبيق pA2 ، pA2 / pKB
  3. البيانات الأولية (مثل K.أنايتم تحويل s إلى سجلها السلبي إلى قيم أساسية 10 (على سبيل المثال pKأناس)
  4. يتم تجاهل الأنشطة التي يعتبرها القيمون على ChEMBL "خارج النطاق النموذجي" (لمنع الانحراف)
  5. يتم تضمين فحوصات الربط ('B') والوظيفية ('F') فقط (لا توجد بيانات فحص على نطاق واسع)

جداول بيانات النشاط - توجد أسفل المخططات جداول تسرد جميع نقاط البيانات المضمنة في مجموعة البيانات. وهي مقسمة حسب الهدف والأنواع ويتم الإشارة إلى قاعدة بيانات المصدر ، مع وصف الفحص إذا كان متاحًا. نوع البيانات القياسي GtoPdb (pKد، صأنا، صورة50، pEC50 أو pA2) والقيمة جنبًا إلى جنب مع القيمة والنوع الأصلي لقاعدة البيانات المصدر (والتي قد تكون البيانات الأصلية التي تم الإبلاغ عنها في المنشور أو التي تم تنسيقها من قبل فريق ChEMBL باستخدام أحد أنواع الأنشطة المذكورة أعلاه). نوصي دائمًا بالتحقق من البيانات الموجودة في المرجع الأصلي ، والذي يتم توفيره مع ارتباط PubMed.

* لمزيد من المعلومات حول ChEMBL ، راجع منشورهم:

Gaulton A ، Hersey A ، Nowotka M ، Bento AP ، Chambers J ، Mendez D ، Mutowo P ، Atkinson F ، Bellis LJ ، Cibrián-Uhalte E ، Davies M ، Dedman N ، Karlsson A ، Magariños MP ، Overington JP ، Papadatos G ، سميت أنا ، ليتش أر. (2017) "قاعدة بيانات ChEMBL في عام 2017." الدقة الأحماض النووية. ، 45 (D1). DOI: 10.1093 / nar / gkw1074. [PMCID: 5210557]

هيكل ثنائي الأبعاد - صورة للهيكل ثنائي الأبعاد للرابط. بالنسبة للجزيئات الصغيرة ذات الابتسامات ، يتم رسمها باستخدام محلل المعرف الكيميائي NCI / CADD. انقر على الصورة للوصول إلى أداة البحث عن التركيب الكيميائي مع الارتباط المحمل مسبقًا في محرر الهيكل. لأنواع أخرى من الروابط ، على سبيل المثال أطول نيوكليوتيدات وببتيدات ، يمكن توفير تمثيل مرسوم يدويًا للجزيء.

الخصائص الفيزيائية والكيميائية المحسوبة - الخصائص الجزيئية المحسوبة متاحة للجزيئات الصغيرة والمنتجات الطبيعية (وليس الببتيدات). تم إنشاء الخصائص باستخدام مجموعة أدوات CDK. تم اختيار جميع الخصائص لتمكين التنبؤ بملف تعريف Lipinski Rule-of-Five أو "الميل إلى المخدرات" لكل رابط:

عدد متقبلي رابطة الهيدروجين عدد المتبرعين برابطة الهيدروجين عدد الروابط القابلة للدوران الوزن الجزيئي مساحة السطح القطبية الطوبولوجية تُعرف مساحة السطح القطبية (PSA) بأنها مجموع السطح فوق جميع الذرات القطبية (عادةً الأكسجين والنيتروجين) ، بما في ذلك الهيدروجين المرفقة أيضًا. مساحة السطح القطبية الطوبولوجية هي معلمة مفيدة (واصف جزيئي) تستخدم لتحسين نفاذية الخلية من قبل الكيميائيين الطبيين. يتم إنشاؤه من خلال حساب مساهمات المجموعة الوظيفية. للحصول على تفاصيل حول المنهجية المستخدمة انظر
Ertl، P.، Rohde، B.، and Selzer، P. (2000) الحساب السريع لمساحة السطح القطبي الجزيئي كمجموع من المساهمات القائمة على الأجزاء وتطبيقها على التنبؤ بخصائص نقل الدواء. جيه ميد. تشيم. 43، 3714 - 3717. XLogP سجل معامل التقسيم (LogP) هو لوغاريتم نسبة تركيزات المركب غير المتأين بين حلين (الأوكتانول والماء). يعتمد توقع LogP على طريقة نوع الذرة تسمى XLogP كما هو مطبق في KNIME. للحصول على تفاصيل المنهجية انظر
Wang، R.، Fu، Y.، and Lai، L. (1997) طريقة مضافة ذرية جديدة لحساب معاملات التقسيم. مجلة المعلومات الكيميائية وعلوم الحاسوب. 37، 615-621. لا ، فإن قواعد ليبينسكي تخرق قاعدة ليبينسكي الخمسة ، وهي قاعدة عامة لتقييم "الميل إلى العقاقير" ، أو تحديد ما إذا كان لمركب كيميائي له نشاط دوائي أو بيولوجي معين خصائص تجعله عقارًا فعالًا عن طريق الفم لدى البشر. لمزيد من التفاصيل انظر
ليبينسكي ، كاليفورنيا ، لومباردو ، إف ، دوميني ، بي دبليو ، وفيني ، بي جيه (1997) الأساليب التجريبية والحاسوبية لتقدير قابلية الذوبان والنفاذية في إعدادات اكتشاف وتطوير الأدوية. ادف المخدرات ديل القس. 23, 3–25.

SMILES / InChI / InChIKey - تنزيلات الهيكل - تمثيلات مختلفة للبنية الجزيئية ثنائية الأبعاد ليجند ، تم إنشاؤها باستخدام Open Babel. وهذه هي:

SMILES (مواصفات إدخال خط إدخال جزيئي مبسط) مواصفات لوصف لا لبس فيه بنية الجزيئات الكيميائية باستخدام سلاسل ASCII القصيرة. ابتسامات الكنسي حدد تمثيلًا فريدًا للهيكل ثنائي الأبعاد بدون مواصفات غير متجانسة أو نظيرية. ابتسامات متساوية تشمل المواصفات والنظائر اللولبية. معيار InChI (IUPAC International Chemical Identifier) ​​و InChIKey InChI هو معرف نصي غير مسجل الملكية للمواد الكيميائية مصمم لتسهيل ربط المعلومات والبحث في قاعدة البيانات. يعد InChIKey إصدارًا مبسطًا من InChI الكامل ، وهو مصمم لتسهيل البحث على الويب.

منظمة الصحة العالمية - تشير إلى الروابط التي تم تضمينها في القائمة النموذجية لمنظمة الصحة العالمية للأدوية الأساسية (القائمة 21 ، 2019).

الدواء المسحوب - لم يعد معتمدًا للاستخدام السريري الأصلي ، وفقًا لما أخطرته إدارة الغذاء والدواء الأمريكية ، عادةً كنتيجة لمشاكل السلامة أو الآثار الجانبية.

توقف الدواء - لم يعد يُسوَّق للاستخدام السريري الروتيني ولكن لم يُسحب بسبب التأثيرات السلبية. عادةً ما تم استبدال هذه الأدوية بأحدث الأدوية وأكثر فاعلية.

العقاقير الأولية - تم تغيير المادة تساهميًا إلى عقار فعال بعد الإعطاء ، عن طريق التمثيل الغذائي النشط أو التحلل المائي السلبي. يمكن أن تكون العقاقير الأولية غير نشطة. سيكون لكل من العقاقير الأولية والأدوية المعتمدة أسماء مختلفة من INN بينما قد يكون للأدوية الأولية والأدوية أسماء رموز مختلفة. ترتبط العقاقير الأولية بصفحات قاعدة بيانات الأدوية والعكس صحيح.

كما يتم توفير فئات الأدوية DrugBank حيثما أمكن ذلك.

اسم IUPAC - اسم كيميائي منتظم تم إنشاؤه وفقًا لقواعد IUPAC باستخدام محلل المعرف الكيميائي NCI / CADD

الاسم الدولي غير المسجل الملكية (INN) - الاسم الرسمي غير المسجل الملكية أو الاسم العام الذي يُعطى لمادة صيدلانية ، كما حددته منظمة الصحة العالمية (WHO). يتم سرد المواد التي يكون فيها هذا المركب مكونًا نشطًا.

الأنواع والجينات / السلائف (الببتيدات الداخلية) - تشير الأنواع إلى الكائن (الكائنات) التي تنتج الببتيد بشكل طبيعي. ترتبط معلومات الأنواع بجينات التشفير وسلائف (سلائف) البروتين للببتيد (يتم وصف الجينات والسلائف للإنسان والفئران والفئران عند الاقتضاء ، أو الأنواع الأخرى ذات الصلة). يتم إجراء إدخال ليجند واحد حيث يكون تسلسل الببتيد الناضج متطابقًا عبر أنواع متعددة. إذا كان هناك اختلاف في تسلسل الببتيد عبر أنواع متعددة ، فسيتم إجراء إدخالات منفصلة ليجند لكل نوع بتسلسل مختلف.

ارتباطات قواعد البيانات - توفر رقم الانضمام ووصلات لقواعد البيانات الكيميائية المختارة ، بما في ذلك PubChem و DrugBank و ChEBI و PDB. للحصول على قائمة وأوصاف كاملة ، راجع جدول ارتباطات قاعدة البيانات. يتم توفير أرقام تسجيل CAS حيثما كانت معروفة. رقم سجل CAS هو علامة تجارية مسجلة للجمعية الكيميائية الأمريكية. تتضمن جداول يجند الببتيد روابط لقواعد بيانات الجينوم والبروتين.

يتضمن هذا القسم خيارًا جديدًا لعرض نتائج بحث InChIKey في Google ، والذي تم وصف فائدته مؤخرًا (Southan 2013). بينما يتم استخدام المفتاح بالكامل لإجراء عمليات بحث مطابقة تمامًا لـ ChemSpider ، فإن بحث Google يستخدم فقط "الطبقة" الداخلية المكونة من 14 حرفًا والتي تقترب من الاتصال الجزيئي الأساسي. وبالتالي سوف يسترد جميع الإدخالات ذات الصلة ذات الاختلافات المتماثلة المشفرة في الطبقة الخارجية للمفتاح. النتائج ، التي يتم عرضها عادةً في أقل من 0.5 ثانية بدقة عالية جدًا ، يتم تجميعها من أكثر من 50 مليون InChIKeys مخزنة مؤقتًا بواسطة Google من مجموعة شاملة من قواعد البيانات وموارد الويب. انظر المرجع: Southan C (2013). InChI in the wild: تقييم بحث InChIKey في Google. J Cheminform. 5، 10. [PMID: 23399051]

النشاط البيولوجي - جداول الانتقائية في الأهداف في قاعدة البيانات. يتم فصل البيانات حسب النوع المستهدف (GPCR ، القناة الأيونية ، NHR ، الإنزيم ، المستقبل التحفيزي ، الناقل ، هدف البروتين الآخر) وحسب الأنواع.

الأهداف الطبيعية / الداخلية - الأهداف حيث يعمل الترابط باعتباره الرابط الرئيسي الداخلي أو الطبيعي.

الإنزيمات / الناقلات - حيث تكون المادة الكيميائية جزءًا من تفاعل إنزيم مشروح في قاعدة البيانات أو يُعرف بأنها ركيزة لبروتين ناقل في قاعدة البيانات ، يتم سردها.

بيانات الفرز - في حالة وجود بيانات فحص ليجند على نطاق واسع في قاعدة البيانات ، يتم تضمينها في جداول منفصلة. عادةً ما يتم تطبيق قيمة حدية بحيث يتم عرض الأهداف التي يكون نشاط الرابط فيها أقل من تركيز معين فقط على صفحة الرابط ويتم إعطاء ارتباط إلى المجموعة الكاملة من الأهداف في الشاشة. حيث اختبرت الشاشة متغيرات متعددة للهدف ، يتم عرض بيانات المتغيرات بشكل منفصل.

ملخص الاستخدام السريري - نظرة عامة على الاستخدامات الرئيسية للأدوية المعتمدة في العيادة. يسرد الحالة (الحالات) التي تم استخدام الدواء أو استخدامه لعلاجه. في حالة الأدوية ذات الأهداف المتعددة ، قد يشير هذا المجال إلى أي من هذه الأهداف هو الهدف العلاجي الرئيسي.

آلية العمل والتأثيرات الدوائية - الديناميكا الدوائية هي دراسة التأثيرات الكيميائية الحيوية والفسيولوجية للأدوية على الجسم وتفحص آليات عمل الدواء ، بما في ذلك العلاقة بين تركيز الدواء وتأثيره.

الامتصاص / التوزيع: مراعاة العوامل التي تؤثر على مقدار دخول الدواء المعطى إلى مجرى الدم ومقدار ما هو متاح في المستجيب (أي التوافر البيولوجي عند الهدف الدوائي). بالنسبة للأدوية التي يتم تناولها عن طريق الفم ، يجب مراعاة الذوبان المركب ، ووقت إفراغ المعدة ، ووقت العبور المعوي ، وعدم الاستقرار الكيميائي ، والقدرة على عبور الأغشية المخاطية للأمعاء. إذا كانت هذه العقبات لا يمكن التغلب عليها ، فيجب إيجاد طريق آخر للإدارة. التمثيل الغذائي: الآليات التي يقوم الجسم من خلالها بتفكيك الأدوية. بالنسبة لمعظم الأدوية ذات الجزيئات الصغيرة ، يتم إجراء التمثيل الغذائي بواسطة إنزيمات الأكسدة والاختزال السيتوكروم P450 في الكبد. القضاء: الطرق التي يتخلص الجسم من خلالها من الأدوية ومستقلباتها. الحرائك الدوائية للسكان تأثيرات الدواء في مجموعات محددة ، بناءً على العمر أو الجنس أو العرق أو الوزن أو في المجموعات السكانية التي تعاني من ظروف موجودة مسبقًا ، أو تتطلب بطريقة أخرى اعتبارًا خاصًا (مثل السكان المسنين عند الأطفال). اختلال وظائف الأعضاء اعتبارات الجرعات في السكان الذين يعانون من ضعف عضوي معين ، خاصة في المرضى الذين يعانون من قصور كلوي وكبدي لأن هذه الحالات قد تزعج التمثيل الغذائي والتخلص وبالتالي تؤثر على التوافر البيولوجي الكلي للدواء. في مثل هذه المجموعات قد يكون من الضروري تعديل الجرعة.

روابط ADME - روابط لمعلومات مفصلة عن خصائص ADME.

هيكل الببتيد - تحتوي صفحات يجند الببتيد على معلومات حول تسلسل الببتيد (تسلسل أحادي وثلاثة أحرف من الأحماض الأمينية) مع تعديلات ما بعد الترجمة والكيميائية مفصلة عند الاقتضاء. حيث يتم تمثيل التعديلات اللاحقة للترجمة والكيميائية المناسبة في تسلسل الأحماض الأمينية المكون من ثلاثة أحرف.

روابط مماثلة (جزيئات صغيرة) - تم إنشاء مجموعات روابط مماثلة باستخدام خوارزمية تجميع تم تنفيذها في Pipeline Pilot (Accelrys ، سان دييغو ، كاليفورنيا ، الولايات المتحدة الأمريكية).

التسلسلات ذات الصلة (الببتيدات) - يسرد هذا الجدول حاليًا الببتيدات الأخرى في قاعدة البيانات التي تحتوي على نفس بروتين السلائف ، بالإضافة إلى الببتيدات المقابلة من الأنواع الأخرى ، إذا كانت موجودة في قاعدة البيانات.

تسلسلات أخرى مماثلة (الببتيدات) - يسرد هذا الجدول الببتيدات في قاعدة البيانات ذات التسلسلات المماثلة ، والتي قد تشمل الببتيدات المشتقة صناعياً والداخلية التي لا تُشتق من نفس الجين أو أخصائيي تقويم العظام. تم تجميع التسلسلات باستخدام برنامج h-cd-hit المتاح من CD-HIT Suite. تم تجميع الببتيدات لأول مرة في هوية عالية (90٪) وتم تجميع التسلسلات غير الزائدة في هوية منخفضة (60٪). للحصول على تفاصيل المنهجية انظر
ينغ هوانغ ، وبيفانغ نيو ، وينغ غاو ، وليمين فو ، وويتشونغ لي. (2010) CD-HIT Suite: خادم ويب لتجميع ومقارنة التسلسلات البيولوجية. المعلوماتية الحيوية. 26, 680-682.

قائمة يجند

يوفر دليل قائمة الروابط الترابطية لعلم الصيدلة دليلًا للروابط الموضحة في قاعدة البيانات ، مقسمة إلى مجموعات فرعية وفقًا للفئة الكيميائية. يتم أيضًا توفير قائمة بالأدوية المعتمدة وقائمة بالروابط المصنفة بمجموعة كيميائية ، مثل النظير المشع. يتم فرز الروابط أبجديًا قدر الإمكان.

صفحات المرض

يرتبط بـ - يتم عرض التعدادات لإجمالي الأهداف المرتبطة بالمرض في GtoPdb. كما يتم عرض أعداد الأهداف والروابط ذات الصلة المناعية المرتبطة بالمرض.

المرادفات - المرادفات للمرض.

الوصف - وصف / تعريف للمرض.

روابط قواعد البيانات - روابط خارجية لنفس المرض في مواقع المرض أو OMIM أو Orphanet - حيث تتوفر البيانات.

الأهداف

يقدم كل قسم تفاصيل حول الفيزيولوجيا المرضية ، وبيانات الطفرات وعلم الأدوية المناعي للهدف فيما يتعلق بالمرض. تفاصيل الفيزيولوجيا المرضية التي يدخل فيها الهدف ، بما في ذلك ، إن أمكن ، الروابط الموجودة على الهدف والتي تكون ذات استخدام علاجي. إذا كانت هناك تفاصيل عن الطفرات الفردية التي تؤدي إلى الفيزيولوجيا المرضية ، فسيتم توجيه الاتهام إليها ، مع روابط تعود إلى القسم ذي الصلة من الصفحة المستهدفة التفصيلية لمزيد من التفاصيل.

التفاعل الترابطي المناعي - حيثما كان متاحًا ، يتم عرض جدول للروابط ذات الصلة بالمناعة ، والتي لها أيضًا ارتباط بالمرض. جميع الروابط لديها بيانات تفاعل مع الهدف. يتم عرض حالة الموافقة الخاصة بالرابط ، جنبًا إلى جنب مع تعليقات المنسق وإشارة إلى ما إذا كان الهدف يعتبر الهدف الأساسي للرابط.

يجاندس

جدول بجميع الروابط المنسقة في GtoImmuPdb باعتبارها مرتبطة بالمرض.

مُعتمد - إذا كان الليجند دواء معتمدًا ، فيتم الإشارة إليه ، جنبًا إلى جنب مع جهات الموافقة.

التعليقات السريرية (الاستخدام السريري) - تعليقات الاستخدام السريري هي تعليقات سريرية عامة تتعلق بالرابط وقد لا تكون بالضرورة خاصة بالمرض المعني.

التعليقات السريرية (تعليقات الأمراض المناعية) - هذه تعليقات قيّمة تمت إضافتها على وجه التحديد كجزء من GtoImmuPdb. يقدمون مزيدًا من المعلومات حول الارتباط بين الترابط والمرض في سياق علم الأدوية المناعي.

قائمة الأمراض

يوفر دليل قائمة الأمراض الصيدلانية دليلًا للأمراض الموضحة في قاعدة البيانات. تتوفر حاليًا قائمتان:

جميع الأمراض - جميع الأمراض مع المعلومات المنسقة في GtoPdb
مرض مناعي - أمراض ذات صلة مناعية. هذه أمراض ذات صلة بعلم المناعة أو مرتبطة بأهداف وروابط ذات صلة مناعية.

يتم فرز الأمراض أبجديًا قدر الإمكان.

قائمة المصطلحات

إجراءات يجند
ناهض / ناهض كامل يجند يرتبط بمستقبل ويغير حالة المستقبل مما يؤدي إلى استجابة بيولوجية. تعمل الناهضات التقليدية على تثبيت التشكل النشط للمستقبلات وتزيد من نشاط المستقبل. عندما يصل محفز المستقبل الناجم عن ناهض إلى قدرة الاستجابة القصوى للنظام (الأنسجة) ، فإنه ينتج استجابة قصوى للنظام ويكون ناهضًا كاملًا في هذا النظام
ناهض معكوس الرابطة الرابطة التي تربطها بمستقبلات غير مشغولة تقلل من جزء منها في شكل نشط. بالنسبة للمستقبلات النووية ، يشير الناهض العكسي إلى الروابط التي يمكن أن تعزز تجنيد القمع المشترك
ناهض جزئي ناهضات أنه في نسيج معين ، في ظل ظروف معينة ، لا يمكن أن ينتج تأثيرًا كبيرًا (حتى عند استخدامه بتركيز عالٍ ، بحيث يجب شغل جميع المستقبلات) كما يمكن أن يعمل ناهض آخر من خلال نفس المستقبلات في نفس النسيج
المنشط الروابط التي تنشط القنوات الأيونية من خلال الارتباط بها مباشرة ، بما في ذلك الروابط التي تسبب تغييرًا في الاعتماد على الجهد لبوابة القناة التي تفضل التنشيط
خصم المضاد هو دواء يقلل من تأثير عقار آخر ، وهو ناهض بشكل عام
مانع القناة الروابط التي تمنع حركة الأيونات عبر القنوات الأيونية
المانع الروابط التي تمنع بوابات القنوات الأيونية عن طريق الارتباط المباشر بالقنوات ، بما في ذلك الروابط التي تمنع تنشيط القناة الأيونية وتلك التي تمنع تعطيل القناة الأيونية
منظم خيفي يجند يزيد (إيجابي) أو يقلل (سلبي) من تأثير ناهض أو مضاد من خلال الاندماج مع موقع متميز على جزيء المستقبل. ترتبط الروابط الترابطية المحايدة بموقع خيفي دون التأثير على ارتباط أو وظيفة الروابط المتعامدة ولكن لا يزال بإمكانها منع عمل المُعدِّلات الخيفية الأخرى التي تعمل عبر نفس الموقع الخيفي
يجند تقويمي الروابط التي تعمل عن طريق الارتباط بنفس الموقع كما يفعل الناهض الفسيولوجي للمستقبلات
التقوية يشير إلى التأثير المعزز لمنظم خيفي يعمل في قناة أيونية
كبت يشير إلى التأثير المثبط لمنظم خيفي يعمل في قناة أيونية
الانتقائية عندما يكون نوع الترابط انتقائيًا لمستقبل معين أو وحدة فرعية للقناة الأيونية ، يُشار إلى ذلك على وجه التحديد
موقع العمل في بعض القنوات الأيونية ، يتم تحديد الوحدة الفرعية المعينة التي يرتبط بها الرابط
مفهوم في بعض الحالات ، يتم تحديد سياق الترابط (داخل الخلايا ، أو اللمعة ، أو العصاري الخلوي ، أو خارج الخلية)
تصنيفات يجند
وافق جميع الروابط الموجودة في قاعدة البيانات والتي تمت الموافقة عليها حاليًا أو تم اعتمادها في الماضي للاستخدام السريري البشري من قبل وكالة تنظيمية
من الذى الروابط التي تم تضمينها في قائمة نموذج منظمة الصحة العالمية للأدوية الأساسية (القائمة 21 ، 2019)
المواد العضوية الاصطناعية مركبات غير بوليمرية منخفضة الوزن الجزيئي تنتج إما عن طريق التخليق الكلي أو العمليات شبه الاصطناعية
المستقلبات مركبات ذات وزن جزيئي منخفض ، غير هضمية ، حيوية المنشأ تنتج عن عمليات الحياة (عادة ما تكون داخلية المنشأ ومن أصل حيواني ، بما في ذلك الهرمونات والناقلات العصبية) ونظائرها القريبة
منتجات طبيعية مركبات غير هضمية وحيوية المنشأ مشتقة من الكائنات الحية ومشتقاتها الاصطناعية القريبة
الببتيدات الذاتية الببتيدات المشفرة في جينومات الإنسان والفئران والفئران
الببتيدات الأخرى الببتيدات الاصطناعية وشبه الاصطناعية والطبيعية المشفرة في جينومات أخرى غير البشر والجرذان والفئران (بما في ذلك الببتيدات قليلة الببتيدات والببتيدات الحلقية)
مواد غير عضوية الأيونات والمركبات غير العضوية الأخرى
الأجسام المضادة بما في ذلك الأجسام المضادة العلاجية وحيدة النسيلة.
مجسات / روابط مسماة يجند يسمح باشتقاق البيانات الدوائية الكمية من تفاعلاته مع شريك ملزم ، عادةً من خلال استخدام الأساليب الفيزيائية الحيوية. وبالتالي ، فإن غالبية هذه المجسات "موسومة إشعاعيًا" أو موسومة بنظائر غير مستقرة ، بشكل تقليدي مع 3 H- أو 14 C- أو 125 I- أو 35 S-. في الآونة الأخيرة ، يستخدم التصوير المقطعي بالإصدار البوزيتروني PET (التصوير المقطعي بالإصدار البوزيتروني) 11 C- أو 18 بروابط تحمل علامة F ، وهي أيضًا ذرات غير مستقرة. غالبًا ما يستخدم التصوير المقطعي المحوسب بإصدار فوتون واحد (SPECT) نظيرًا ثابتًا 99 mTc-. يشار إلى هذه الروابط ذات العلامات الإشعاعية أحيانًا باسم الراديوليجاند. يعد استخدام أشكال النظائر المستقرة من الروابط حاليًا أكثر شيوعًا في دراسات التمثيل الغذائي. بدلاً من ذلك ، يمكن تسمية المجسات بعلامات الفلورسنت أو الكيانات الكيميائية الصغيرة ، مثل البيوتين.
مناعي تم وضع علامة Ligands على وجه التحديد على أنها ذات صلة بعلم الأدوية المناعي ودليل IUPHAR لعلم الأدوية المناعي
مضاد للذكور الروابط المضادة للملاريا ، تشمل تلك التي تم وضع علامة عليها باعتبارها ذات صلة بدليل IUPHAR / MMV لدواء الملاريا
برنامج التعاون الفني قوائم الروابط المضادة للملاريا ، تتضمن تلك التي تم وضع علامة عليها باعتبارها ذات صلة بـ IUPHAR / MMV Guide to Malaria Pharmacology ، والتي تعد بيانات ملف تعريف المرشح المستهدف (TCP) الخاصة بها.
المعلومات والخصائص الهيكلية ليجند
الابتسامات (مواصفات إدخال خط إدخال جزيئي مبسط) مواصفات لوصف هيكل الجزيئات الكيميائية بشكل لا لبس فيه باستخدام سلاسل ASCII القصيرة
ابتسامات الكنسي تحدد الابتسامات تمثيلًا فريدًا للهيكل ثنائي الأبعاد بدون مواصفات غير متجانسة أو نظيرية
ابتسامات متساوية الابتسامات تشمل المواصفات اللولبية والنظيرية
معرف معيار InChI (IUPAC International Chemical Identifier) ​​InChI هو معرف نصي غير مسجل الملكية للمواد الكيميائية مصمم لتسهيل ربط المعلومات والبحث في قاعدة البيانات
مفتاح InChI القياسي يعد InChIKey إصدارًا مبسطًا من InChI الكامل ، وهو مصمم لتسهيل البحث على الويب
الخصائص الفيزيائية والكيميائية المحسوبة الخصائص الجزيئية المحسوبة متاحة للجزيئات الصغيرة والمنتجات الطبيعية (وليس الببتيدات). تم إنشاء الخصائص باستخدام مجموعة أدوات CDK. تم اختيار جميع الخصائص لتمكين التنبؤ بملف تعريف Lipinski Rule-of-of-Five أو "الميل إلى المخدرات" لكل يجند.
معلومات المستقبلات
التسمية التسمية الموصى بها لهدف متميز هيكليًا وتشغيليًا في عائلة معينة. عندما يكون هذا هو المصطلح الموصى به المنشور في NC-IUPHAR ، يتم تحديد ذلك في قسم نظرة عامة مع مراجع للمقالات ذات الصلة في المراجعات الدوائية. في الحالات التي لا توجد فيها توصيات NC-IUPHAR منشورة ، عادة ما تكون التسمية المعتمدة واحدة من: اسم الجين المعتمد من HGNC ، وهو اسم شائع الاستخدام في الأدبيات أو توصية أولية من NC-IUPHAR.
التنبيغ الرئيسي الخصائص الجزيئية المحسوبة متاحة للجزيئات الصغيرة والمنتجات الطبيعية (وليس الببتيدات). تم إنشاء الخصائص باستخدام مجموعة أدوات CDK. تم اختيار جميع الخصائص لتمكين التنبؤ بملف تعريف Lipinski Rule-of-of-Five أو "الميل إلى المخدرات" لكل يجند.
الخصائص الوظيفية يقدم تفاصيل عن خصائص التوصيل ، والاعتماد على الجهد ، والتصحيح والانتقائية للقنوات الأيونية
هس ، مم ، آكانيوز يشير إلى أنواع الهدف. Hs: Homo sapiens Mm: Mus musculus Rn: Rattus norvegicus
المقاييس التجريبية لعمل يجند
EC50 التركيز المولي للناهض الذي ينتج 50٪ من أقصى تأثير ممكن لهذا الناهض. قيم النسبة المئوية الأخرى (EC20، EC40، إلخ). قد يكون عمل الناهض محفزًا أو مثبطًا
IC50 يستخدم هذا المصطلح بعدة طرق: (1) التركيز المولي للمضاد الذي يقلل من الاستجابة للناهض بنسبة 50٪ ، يجب إعطاء تركيز الناهض (2) التركيز المولي للناشط أو المضاد غير المحدد الذي يثبط يجب أن يُعطى ارتباط الراد المشع بنسبة 50٪ تركيز الراديوليجند (3) التركيز المولي للناشط المثبط الذي يقلل من الاستجابة بنسبة 50٪ من الحد الأقصى للتثبيط الذي يمكن تحقيقه هذا الاستخدام الأخير غير موصى به - بدلاً من ذلك ، لا يُنصح باستخدام المصطلح ، EC50، يجب استخدامه لأن هذا تأثير ناهض
كب كب يشير إلى ثابت تفكك التوازن للرابط (تقليديًا ، مضاد تنافسي) يتم تحديده عن طريق اختبار وظيفي
كد كد يشير إلى ثابت تفكك التوازن للرابط الذي تم تحديده مباشرة في اختبار ملزم باستخدام شكل مُسمى من ligand
كأنا كأنا يشير إلى ثابت تفكك التوازن لرابط محدد في دراسات التثبيط. عادةً ما يتم تحديد Ki لرابط معين (ولكن ليس بالضرورة) في دراسة ربط إشعاعي تنافسي عن طريق قياس تثبيط ارتباط إشارة إشعاعية مرجعية بواسطة الرابطة المتنافسة ذات الأهمية في ظل ظروف التوازن
كم ثابت ميكايليس (K.م) يحدد تركيز الركيزة التي يكون فيها معدل التفاعل نصف المعدل الأقصى (Vالأعلى) حققه النظام بأقصى تركيزات الركيزة.
pA2 pA2 اللوغاريتم السالب للقاعدة 10 للتركيز المولي للمضاد الذي يجعل من الضروري مضاعفة تركيز المادة الناهضة اللازمة لاستنباط الاستجابة دون القصوى الأصلية التي تم الحصول عليها في غياب المضاد
بيك50 اللوغاريتم السالب للأساس 10 من EC50 من ناهض
صورة50 اللوغاريتم السالب للأساس 10 من IC50 من ناهض أو مناهض
pKب اللوغاريتم السالب للأساس 10 من Kب
pKد اللوغاريتم السالب للأساس 10 من Kد
pKأنا اللوغاريتم السالب للأساس 10 من Kأنا
pKم اللوغاريتم السالب للأساس 10 من Kم
نطاق التركيز في حالة عدم توفر بيانات التقارب ، يتم عرض نطاق تركيز الترابط المستخدم للدراسة (في M)
ترتيب الفعالية ترتيب فاعلية نشاط سلسلة من الروابط في هدف معين
ترتيب التقارب ترتيب قوة ربط الركيزة لإنزيم معين

روابط قاعدة البيانات

قواعد بيانات الجينات والبروتين
فرقة يوفر موردًا مركزيًا لعلماء الوراثة وعلماء الأحياء الجزيئية والباحثين الآخرين الذين يدرسون جينومات حقيقية النواة. إنه قادر على إنشاء عروض رسومية تلقائيًا لمحاذاة الجينات والبيانات الجينومية الأخرى ضد الجينوم المرجعي.
انتريز جين يدمج المعلومات من مجموعة واسعة من الأنواع. قد يشتمل السجل على التسمية والتسلسلات المرجعية (RefSeqs) والخرائط والمسارات والاختلافات والأنماط الظاهرية والروابط إلى موارد الجينوم والنمط الظاهري والموقع في جميع أنحاء العالم.
HGNC المصدر المعتمد لأسماء ورموز الجينات البشرية المعتمدة. يوافق HGNC على اسم فريد وذا معنى لكل جين بشري معروف بناءً على استفسار من الخبراء.
أطلس البروتين البشري (HPA) مورد شامل لأنماط التعبير عن الأنسجة والخلية وكذلك التوزيعات داخل الخلايا. يتضمن أيضًا أطلس علم الأمراض مع التركيز على سرطان الإنسان.
KEGG يشتمل مورد قاعدة البيانات لفهم الوظائف والمرافق عالية المستوى للنظام البيولوجي ، مثل الخلية والكائن الحي والنظام الإيكولوجي ، على معلومات من مجموعات البيانات الجزيئية واسعة النطاق الناتجة عن تسلسل الجينوم وغيرها من التقنيات التجريبية عالية الإنتاجية.
MGD يتضمن بيانات عن توصيف جينات الفأر ، والتسميات ، ورسم الخرائط ، والتماثلات الجينية بين الثدييات ، وروابط التسلسل ، والأنماط الظاهرية ، والمتغيرات الأليلية والطفرات ، وبيانات السلالة.
بلاسمودب قاعدة بيانات للجينوم لجنس المتصورة ، مسببات الأمراض أحادية الخلية حقيقية النواة التي تسبب أمراضًا للإنسان والحيوان ، بما في ذلك الملاريا.
RGD يوفر الوصول إلى أحدث مجموعة كاملة من البيانات الجينية والوراثية للجرذان المتاحة ، بالإضافة إلى الأدوات الأكثر ابتكارًا لتحليل هذه البيانات.
المرجع قاعدة بيانات توفر مجموعة مشروحة ومنظمة من متواليات النيوكليوتيدات المتاحة للجمهور (DNA ، RNA) ومنتجاتها البروتينية ، مع سجلات منفصلة ومترابطة للحمض النووي الجيني ، ونصوص الجينات ، والبروتينات الناشئة عن تلك النسخ.
UniProtKB قاعدة بيانات لتسلسل البروتين والمعلومات الوظيفية ، والعديد منها مشتق من مشاريع تسلسل الجينوم. يحتوي على كمية كبيرة من المعلومات حول الوظيفة البيولوجية للبروتينات المستمدة من الأدبيات البحثية.
قواعد بيانات بنية البروتين
CATH / Gene3D CATH هو تصنيف لبنية بروتين بنك بيانات البروتين (PDB) مجمعة حسب مجالات البروتين في عائلات فائقة تباعدت عن سلف مشترك. تشمل الأدوات المساعدة تتبع التطور العميقة للتطور الدوائي للأهداف (التي لها هياكل) حيث يصعب اكتشاف ذلك على أساس تشابه التسلسل وحده.
RCSB PDB مستودع للبيانات الهيكلية ثلاثية الأبعاد للجزيئات البيولوجية الكبيرة ، مثل البروتينات والأحماض النووية. يتم الحصول على البيانات عادةً عن طريق التصوير البلوري بالأشعة السينية أو التحليل الطيفي بالرنين المغناطيسي النووي. يتم أيضًا تبلور العديد من البروتينات مع الروابط.
التزامن تم إعداده في الأصل لتزويد علماء الأحياء الاصطناعية بأدوات لاكتشاف التسلسلات التي يمكن تعديلها بواسطة روابط معروفة من GtoPdb ، والتي يمكن نقلها إلى البروتينات الاصطناعية من أجل منح السيطرة على الأدوية. يجمع المعلومات الهيكلية من RCSB PDB مع بيانات ربط الترابط من GtoPdb لإنتاج قاعدة بيانات لتسلسلات ربط الروابط.
قواعد بيانات الصيدلة
ملزم ديسيبل قاعدة بيانات عامة يمكن الوصول إليها على شبكة الإنترنت من تقاربات الربط المقاسة ، وتركز بشكل أساسي على تفاعلات البروتين التي تعتبر أهدافًا للأدوية مع جزيئات صغيرة تشبه الأدوية.
شيمبل مورد عبر الإنترنت لبيانات نشاط هيكل الجزيء الصغير النشط بيولوجيًا ، بما في ذلك الهياكل ثنائية الأبعاد ، والخصائص المحسوبة والأنشطة الحيوية المنسقة من أدبيات الكيمياء الطبية. يتم توفير روابط ليجند والصفحات المستهدفة.
DrugBank مورد للمعلوماتية الحيوية والمعلوماتية التي تجمع بين بيانات الأدوية التفصيلية (أي البيانات الكيميائية والدوائية والصيدلانية) مع معلومات شاملة عن الهدف الدوائي (أي التسلسل والهيكل والمسار). لاحظ أن DrugBank مجاني للاستخدام الأكاديمي وغير الربحي ولكن المستخدمين التجاريين يحتاجون إلى ترخيص.
قواعد بيانات الكيمياء
تشيبي قاعدة بيانات وأنطولوجيا للكيانات الجزيئية تركز على المركبات الكيميائية "الصغيرة". هذه الكيانات الجزيئية هي إما منتجات طبيعية أو منتجات تركيبية تستخدم للتدخل في عمليات الكائنات الحية. لا يتم تضمين الجزيئات المشفرة مباشرة بواسطة الجينوم ، مثل الأحماض النووية والبروتينات والببتيدات المشتقة من البروتينات عن طريق الانقسام المحلل للبروتين ، كقاعدة في ChEBI.
بوبكيم قاعدة بيانات للجزيئات الكيميائية وأنشطتها ضد المقايسات البيولوجية.
يونيكيم يوفر إحالة مرجعية لأكثر من 150 مليون معرف للتركيب الكيميائي من 33 مصدرًا (بما في ذلك GtoPdb).
قواعد بيانات المرض / المتغير
dbSNP تقوم قاعدة بيانات NCBI للتنوعات الجينية القصيرة (dbSNP) بفهرسة الاختلافات القصيرة في تسلسل النيوكليوتيدات من مجموعة واسعة من الكائنات الحية.
OMIM قاعدة بيانات تقوم بفهرسة جميع الأمراض البشرية المعروفة ذات المكون الجيني وتربطها بالجينات والمراجع والأدوات ذات الصلة للتحليل الجينومي.
يتيمة مورد يوفر قائمة جرد وتصنيف وموسوعة للأمراض النادرة والجينات المرتبطة بها.
UniProtKB / متغير Swiss-Prot ملخص للمعلومات المتعلقة بالمتغيرات والمعلومات المحسوبة مثل حفظ المخلفات المعدلة عبر الأنواع المتعامدة.
قواعد بيانات الجسم المضاد
IMGT / mAb-DB قاعدة بيانات للأجسام المضادة وحيدة النسيلة (IG ، mAb) وبروتينات الاندماج للتطبيقات المناعية (FPIA).
قواعد البيانات الخاصة بـ GPCR
BitterDB قاعدة بيانات للمركبات المرة التي تم الحصول عليها من الأدبيات ومن مؤشر Merck ومستقبلات الطعم المر للإنسان المرتبطة بها (hT2Rs).
GPCRDB نظام معلومات لـ GPCRs يحتوي على بيانات عن التسلسلات وثوابت ربط الترابط والطفرات جنبًا إلى جنب مع أدوات للمساعدة في التصور وتحليل البيانات.
قواعد البيانات الخاصة بالمستقبلات النووية
نورسا يعد أطلس إشارات المستقبلات النووية مصدرًا للمعلومات التي تم التحقق من صحتها حول إشارات المستقبلات النووية وهيكلها ووظيفتها ودورها في المرض.
قواعد البيانات الخاصة بالإنزيم
بريندا مورد يشتمل على معلومات جزيئية وكيميائية حيوية عن الإنزيمات التي تم تصنيفها بواسطة IUBMB. يتميز كل إنزيم مصنّف فيما يتعلق بالتفاعل الكيميائي الحيوي المحفز.
KEGG برايت مجموعة من التصنيفات الهرمية التي تمثل جوانب مختلفة من النظم البيولوجية.
ميروبس توفر قاعدة بيانات MEROPS الوصول إلى المعلومات المتعلقة بالببتيدات (أو البروتياز) والبروتينات والجزيئات الصغيرة التي تثبطها ، والتي يتم تقديمها في نظام تصنيف هرمي قائم على الهيكل.
قواعد البيانات الخاصة بالناقل
جداول Bioparadigms SLC معلومات الجينوم الوظيفي عن ناقلات SLC (Solute Carrier)
قواعد البيانات العامة
PubMed ترتبط المراجع في Guide to PHARMACOLOGY ارتباطًا مباشرًا بالاستشهادات في PubMed باستخدام معرفات PubMed.
مشروع تعليم الصيدلة IUPHAR (PEP) PEP هي مبادرة IUPHAR لتوفير الوصول المجاني إلى موارد التعليم والتدريب في علم الأدوية. يحتوي على معلومات أساسية ومواد تعليمية للعديد من المصطلحات الدوائية والموضوعات والأهداف والروابط المذكورة في GtoPdb.
ويكيبيديا على الرغم من أنه ليس دائمًا موثوقًا به ، فإنه غالبًا ما يوفر معلومات عامة وسهلة الهضم عن العقاقير والأدوية المستهدفة.

عند إضافة روابط جديدة إلى GtoPdb ، فإننا ننشر عادةً تفاصيل وأمثلة مفيدة على مدونتنا. على سبيل المثال ، يصف منشور المدونة هذا من أغسطس 2017 فائدة العديد من هذه الروابط ، بما في ذلك وسائل استدعاء UniChem InChIKey.


Ssbio.databases ¶

PDBProp¶

قم بتخزين المعلومات حول بنية البروتين من بنك بيانات البروتين.

يوسع فئة StructProp للسماح بتهيئة الهيكل من خلال معرف PDB الخاص به ، ثم تمكين تنزيلات ملف الهيكل وكذلك تحليل البيانات الوصفية الخاصة به.

  • الهوية (شارع) –
  • وصف (شارع) –
  • السلاسل (شارع) –
  • mapped_chains (شارع) –
  • هيكل_المسار (شارع) –
  • نوع الملف (شارع) - pdb، mmCif، xml، mmtf - نوع الملف للملفات التي تم تنزيلها من PDB

قائمة دكت - قائمة لتخزين كائنات Bioassembly ذات الصلة بمعرّف PDB هذا

download_structure_file ( outdir, file_type = لا شيء, load_header_metadata = صحيح, force_rerun = خطأ ) [مصدر] ¶

قم بتنزيل ملف هيكل من PDB ، مع تحديد دليل الإخراج ونوع الملف. يمكنك اختياريًا تنزيل ملف رأس mmCIF وتحليل البيانات منه لتخزينها داخل هذا الكائن.

  • outdir (شارع) - المسار إلى دليل الإخراج
  • نوع الملف (شارع) - pdb، mmCif، xml، mmtf - نوع الملف للملفات التي تم تنزيلها من PDB
  • load_header_metadata (منطقي) - إذا كان يجب تحميل بيانات تعريف الرأس في هذا الكائن ، فسيكون أسرع مع ملفات mmtf
  • القوة (منطقي) - إذا كان يجب تنزيل ملف الهيكل حتى لو كان موجودًا بالفعل

استخدم خدمة PDBe REST للاستعلام عن أفضل هياكل PDB لمعرف UniProt.

تم العثور على مزيد من المعلومات هنا: https://www.ebi.ac.uk/pdbe/api/doc/sifts.html الرابط المستخدم لاسترداد النتائج: https://www.ebi.ac.uk/pdbe/api/mappings/ best_structures /: accession قائمة هياكل PDB التي ترسم خرائط لمدخل UniProt مرتبة حسب تغطية البروتين ، وإذا كانت كذلك ، الدقة.

فيما يلي خوارزمية الترتيب الموضحة في ورقة PDB: https://nar.oxfordjournals.org/content/44/D1/D385.full

"أخيرًا ، يتم أيضًا حساب مؤشر جودة واحد لكل إدخال عن طريق أخذ المتوسط ​​التوافقي لجميع الدرجات المئوية التي تمثل مقاييس جودة نموذج وملاءمة بيانات النموذج ثم طرح 10 أضعاف القيمة الرقمية للدقة (في أنجستروم) الدخول للتأكد من أن القرار يلعب دورًا في توصيف جودة الهيكل. يتم استخدام قيمة "مقياس الجودة" التجريبية الفردية هذه بواسطة نظام الاستعلام PDBe لفرز النتائج وتحديد الهيكل "الأفضل" في سياق معين. في الوقت الحالي ، لا تحتوي الإدخالات المحددة بطرق أخرى غير علم البلورات بالأشعة السينية على معلومات جودة بيانات مماثلة متاحة ولا تعتبر "أفضل الهياكل".

  • uniprot_id (شارع) - معرف انضمام UniProt
  • الاسم الخارجي (شارع) - الاسم الأساسي لملف الإخراج لنتائج JSON
  • outdir (شارع) - المسار إلى دليل الإخراج لنتائج JSON
  • seq_ident_cutoff (تطفو) - نتائج القطع بناءً على النسبة المئوية للتغطية (في شكل عشري)
  • القوة (منطقي) - الحصول على خرائط أفضل الهياكل مع تجاهل النتائج التي تم تنزيلها مسبقًا
  • pdb_id: معرّف PDB الذي يعيّن معرّف UniProt
  • chain_id: السلسلة المحددة لـ PDB التي تعين معرف UniProt
  • التغطية: النسبة المئوية لتغطية تسلسل UniProt بأكمله
  • القرار: قرار الهيكل
  • start: رقم بقايا الهيكل الذي يخطط لبداية التسلسل المعين
  • النهاية: رقم بقايا الهيكل الذي يخطط لنهاية التسلسل المعين
  • unp_start: رقم بقايا التسلسل الذي يبدأ الهيكل
  • unp_end: رقم بقايا التسلسل الذي يحدد نهاية الهيكل
  • الطريقة التجريبية: نوع التجربة المستخدمة لتحديد البنية
  • tax_id: المعرّف التصنيفي للكائن الأصلي للبروتين

تُرجع قائمة بلاست عدد مرات الوصول إلى تسلسل إلى الهياكل المتاحة في PDB.

  • فيما يليها (شارع) - التسلسل الخاص بك ، في شكل سلسلة
  • ملف (شارع) - اسم ملف الإخراج
  • outdir (شارع,اختياري) - المسار إلى دليل الإخراج. الافتراضي هو الدليل الحالي.
  • تقييم (تطفو,اختياري) - قطع القيمة E - فلاتر للحصول على نتائج مهمة. 0.001 ليبرالي ، 0.0001 صارم (افتراضي).
  • seq_ident_cutoff (تطفو,اختياري) - نتائج القطع بناءً على النسبة المئوية للتغطية (في شكل عشري)
  • حلقة الوصل (منطقي,اختياري) - اضبط على True إذا كان يجب عرض رابط لنتائج HTML
  • القوة (منطقي,اختياري) - إذا كان يجب عدم استخدام نتائج BLAST الحالية ، فاضبط على True. الافتراضي هو خطأ

ترتيب قائمة مرتبة بلاست يضرب في القواميس.

قم بعمل إطار بيانات لنتائج بلاست

ssbio.databases.pdb. download_mmcif_header ( pdb_id, outdir = ", force_rerun = خطأ ) [مصدر] ¶

قم بتنزيل ملف رأس mmCIF من RCSB PDB بواسطة المعرف.

  • pdb_id - معرف PDB
  • outdir - دليل الإخراج الاختياري ، الافتراضي هو دليل العمل الحالي
  • القوة - في حالة وجوب تنزيل الملف مرة أخرى حتى لو كان موجودًا

قم بتنزيل ملف SIFTS لمعرف PDB.

  • pdb_id (شارع) - معرف PDB
  • outdir (شارع) - دليل الإخراج ، دليل العمل الحالي إذا لم يتم تحديده.
  • القوة (منطقي) - في حالة وجوب تنزيل الملف مرة أخرى حتى لو كان موجودًا

قم بتنزيل بنية من RCSB PDB بواسطة المعرف. حدد نوع الملف المطلوب.

  • pdb_id - معرف PDB
  • نوع الملف - pdb ، pdb.gz ، mmcif ، cif ، cif.gz ، xml.gz ، mmtf ، mmtf.gz
  • outdir - دليل الإخراج الاختياري
  • فقط_الرأس - إذا كان يجب تنزيل ملف الرأس فقط
  • القوة - في حالة وجوب تنزيل الملف مرة أخرى حتى لو كان موجودًا

مهملة منذ الإصدار 1.0: ستتم إزالتها في 2.0. استخدم دالة PDBList.retrieve_pdb_file في Biopython بدلاً من ذلك

احصل على البيانات الوصفية حول التجميع الحيوي من REST API الخاص بـ RCSB PDB.

راجع: https://www.rcsb.org/pdb/rest/bioassembly/bioassembly؟structureId=1hv4&nr=1 تقوم واجهة برمجة التطبيقات بإرجاع ملف XML يحتوي على معلومات حول التجميع البيولوجي الذي يشبه هذا:

  • pdb_id (شارع) - معرف PDB
  • biomol_num (int) - رقم التجميع البيولوجي الذي تهتم به
  • مخبأ (منطقي) - إذا كان يجب تنزيل ملف XML
  • outdir (شارع) - إذا كانت ذاكرة التخزين المؤقت ، فحدد دليل الإخراج
  • القوة (منطقي) - إذا كانت ذاكرة التخزين المؤقت ، وإذا كان الملف موجودًا ، فحدد ما إذا كان يجب الاستعلام عن API مرة أخرى

تحقق مما إذا كانت هناك مجموعات حيوية تستخدم واجهة برمجة تطبيقات PDB REST ، وإذا كانت موجودة ، فاحصل على عدد المجموعات الحيوية المتاحة.

لا تحتوي جميع إدخالات PDB على تجميعات بيولوجية متاحة وبعضها يحتوي على عدة. يمكن الوصول إلى التفاصيل الضرورية لإعادة إنشاء مجموعة بيولوجية من الوحدة غير المتماثلة من الطلبات التالية.

  • عدد التجمعات البيولوجية المرتبطة بإدخال PDB
  • الوصول إلى معلومات التحويل اللازمة لإنشاء تجميع بيولوجي (nr = 0 سيعيد معلومات للوحدة غير المتماثلة ، nr = 1 سيعيد المعلومات للتجميع الأول ، إلخ.)
  • pdb_id (شارع) - معرف PDB
  • مخبأ (منطقي) - إذا كان يجب تنزيل ملف XML
  • outdir (شارع) - إذا كانت ذاكرة التخزين المؤقت ، فحدد دليل الإخراج
  • القوة (منطقي) - إذا كانت ذاكرة التخزين المؤقت ، وإذا كان الملف موجودًا ، فحدد ما إذا كان يجب الاستعلام عن API مرة أخرى

طريقة سريعة للحصول على تاريخ إصدار معرّف PDB باستخدام جدول النتائج من خدمة REST

إرجاع لا شيء إذا كان تاريخ الإصدار غير متاح.

عائدات:كائن من معرف PDB
نوع الإرجاع:شارع
ssbio.databases.pdb. get_resolution ( pdb_id ) [مصدر] ¶

طريقة سريعة للحصول على دقة معرف PDB باستخدام جدول النتائج من خدمة REST

ترجع اللانهاية إذا كانت الدقة غير متوفرة.

عائدات:حل معرف PDB في أنجسترومس
نوع الإرجاع:تطفو

قم بتعيين رقم بقايا UniProt لرقم بقايا PDB المقابل.

تتطلب هذه الوظيفة تنزيل ملف SIFTS ، وكذلك معرف السلسلة (حيث قد تحتوي السلاسل المختلفة على تعيينات مختلفة).

  • uniprot_resnum (int) - عدد صحيح للرقم المتبقي الذي ترغب في تعيينه
  • chain_id (شارع) - سلسلة من سلسلة PDB للتعيين إليها
  • sifts_file (شارع) - المسار إلى ملف SIFTS XML

mapped_resnum (int): رقم البقايا المعينة is_observed (bool): يشير إلى ما إذا كانت البنية ثلاثية الأبعاد تُظهر بالفعل البقايا

قم بتحليل حقلين مهمين من تنسيق ملف mmCIF مع بعض التنظيم اليدوي للروابط.

إذا كنت تريد الوصول الكامل إلى ملف mmCIF فقط استخدم فئة MMCIF2Dict في Biopython.

العوامل:شرير - المسار إلى ملف mmCIF
عائدات:قاموس الرأس المحلل
نوع الإرجاع:قاموس
ssbio.databases.pdb. parse_mmtf_header ( شرير ) [مصدر] ¶

تحليل ملف MMTF وإرجاع المعلومات الأساسية الشبيهة بالرأس.

العوامل:شرير (شارع) - المسار إلى ملف MMTF
عائدات:قاموس الرأس المحلل
نوع الإرجاع:قاموس

  • هل يمكن تسريع هذا من خلال عدم تحليل معلومات الإحداثيات ثلاثية الأبعاد بطريقة أو بأخرى؟
  • أو فقط قم بتخزين التسلسلات عند حدوث ذلك حيث يتم تحليلها بالفعل.

قم بتنزيل ملف PISA XML لأجهزة multimers.

  • pdb_ids (شارع,قائمة) - معرف PDB أو قائمة المعرفات
  • save_single_xml_files (منطقي) - إذا كان يجب حفظ ملفات XML مفردة لكل معرّف PDB. إذا كان خطأ ، إذا تم توفير معرّفات PDB متعددة ، فسيتم تنزيل ملف إخراج XML واحد ومدمج
  • outdir (شارع) - دليل لإخراج ملفات PISA XML
  • القوة (منطقي) - إعادة تنزيل الملفات إذا كانت موجودة بالفعل

استرجع معلومات PISA من ملف نتائج XML

  • pisa_multimers_xml (شارع) - المسار إلى ملف الإخراج PISA XML
  • تنزيل الهياكل (منطقي) - إذا كان يجب تنزيل ملفات التجميع
  • outdir (شارع) - دليل لإخراج ملفات التجميع
  • القوة (منطقي) - إعادة تنزيل الملفات إذا كانت موجودة بالفعل

من معلومات PISA المحللة

احصل على قياس العناصر المتكافئة للسلاسل في التجميع البيولوجي 1 كقاموس.

الخطوات المتخذة هي: 1) تنزيل PDB ورأس التحليل ، وإنشاء جزيء حيوي إذا تم توفيره 2) حساب عدد المرات التي تظهر فيها كل سلسلة في الجزيء الحيوي # 1 3) تحويل معرف السلسلة إلى معرف uniprot 4) إرجاع القاموس النهائي

العوامل:pdbid (شارع) - 4 أحرف معرف PDB
عائدات:
نوع الإرجاع:قاموس

سويسموديل¶

طرق التحليل من خلال مجموعة بيانات تعريف SWISS-MODEL.

قم بتنزيل البيانات الوصفية لكائن معين من SWISS-MODEL هنا: https://swissmodel.expasy.org/repository

العوامل:metadata_dir (شارع) - المسار إلى مجلد SWISS-MODEL_Repository المستخرج
جميع الموديلات = لا شيء

قاموس - قاموس القوائم ومعرف UniProt كمفاتيح

download_models ( uniprot_acc, outdir = ", force_rerun = خطأ ) [مصدر] ¶

قم بتنزيل جميع الطرز المتاحة لرقم انضمام UniProt.

  • uniprot_acc (شارع) - UniProt ACC / ID
  • outdir (شارع) - المسار إلى دليل الإخراج ، يستخدم دليل العمل إذا لم يتم تعيينه
  • القوة (منطقي) - فرض إعادة تنزيل النماذج إذا كانت موجودة بالفعل

مسارات إلى النماذج التي تم تنزيلها

احصل على المسار إلى نموذج التماثل باستخدام معلومات من قاموس الفهرس لنموذج واحد.

مثال: استخدم self.get_models (UNIPROT_ID) للحصول على جميع النماذج ، والتي تعرض قائمة من القواميس. استخدم أحد هذه القواميس كمدخل لهذه الوظيفة لإحضار مسار الملف إلى النموذج نفسه.

العوامل:المعلومات (قاموس) - معلومات حول نموذج من get_models
عائدات:نموذج المسار إلى التنادد
نوع الإرجاع:شارع
get_models ( uniprot_acc ) [مصدر] ¶

أعد جميع الطرز المتاحة لرقم انضمام UniProt.

العوامل:uniprot_acc (شارع) - UniProt ACC / ID
عائدات:جميع الموديلات المتوفرة في SWISS-MODEL لإدخال UniProt هذا
نوع الإرجاع:قاموس
metadata_dir = لا شيء

شارع - المسار إلى مجلد SWISS-MODEL_Repository المستخرج

شارع - المسار إلى ملف INDEX_JSON.

تنظيم_نماذج ( outdir, force_rerun = خطأ ) [مصدر] ¶

تنظيم وإعادة تسمية نماذج SWISS-MODEL إلى مجلد واحد باسم يحتوي على معلومات القالب.

  • outdir (شارع) - دليل جديد لنسخ النماذج المعاد تسميتها إليه
  • القوة (منطقي) - إذا كان يجب نسخ النماذج مرة أخرى حتى لو كانت موجودة بالفعل

قاموس القوائم ومعرفات UniProt كمفاتيح ومسارات الملفات الجديدة كقيم

قم بتحليل ملف INDEX_JSON وأعد تنظيمه كقاموس من القوائم.

قائمة - أعد جميع أرقام انضمام UniProt مع طراز واحد على الأقل

ssbio.databases.swissmodel. get_oligomeric_state ( swiss_model_path ) [مصدر] ¶

تحليل توقع القلة في ملف مستودع SWISS-MODEL

اعتبارًا من 2018-02-26 ، يعمل على جميع موديلات الإشريكية القولونية. لم يتم اختباره على نماذج أخرى مسبقة الصنع من الكائنات الحية.

العوامل:swiss_model_path (شارع) - المسار إلى ملف SWISS-MODEL PDB
عائدات:تحليل المعلومات حول حالة القلة
نوع الإرجاع:قاموس
ssbio.databases.swissmodel. translate_ostat ( ostat ) [مصدر] ¶

ترجمة حقل OSTAT إلى عدد صحيح.

اعتبارًا من 2018-02-26 ، يعمل على جميع موديلات الإشريكية القولونية. لم يتم اختباره على نماذج أخرى مسبقة الصنع من الكائنات الحية.

العوامل:ostat (شارع) - حالة قليلة القسيمات المتوقعة لملف PDB
عائدات:سلسلة مترجمة إلى عدد صحيح
نوع الإرجاع:int

UniProtProp¶

فئة عامة لتخزين المعلومات على إدخال UniProt ، ممتدة من كائن SeqProp.

المرافق الرئيسية لهذه الفئة هي:

  1. قم بتنزيل و / أو تحليل ملفات UniProt النصية أو ملفات xml
  2. تخزين المزيد من المعلومات المحللة في السمات

شارع - كود الانضمام الرئيسي UniProt

قائمة - رموز الانضمام البديلة التي تشير إلى الرمز الرئيسي

منطقي - إذا كان هذا الإدخال هو إدخال "تمت مراجعته". إذا لم يكن هناك شيء ، فإن الحالة غير معروفة.

شارع - تاريخ آخر تحديث لإدخال UniProt

شارع - تاريخ آخر تحديث لتسلسل UniProt

download_metadata_file ( outdir, force_rerun = خطأ ) [مصدر] ¶

قم بتنزيل وتحميل ملف UniProt XML

download_seq_file ( outdir, force_rerun = خطأ ) [مصدر] ¶

قم بتنزيل وتحميل ملف UniProt FASTA

قائمة - احصل على الميزات من ملف الميزة أو ملف البيانات الوصفية أو في الذاكرة

قم بتوفير درجة لمعرف UniProt بناءً على المراجعة (صواب = 1 ، خطأ = 0) + عدد وحدات PDB

عائدات:سجل لهذا المعرف
نوع الإرجاع:int
seq ¶

تسلسل - احصل على كائن التسلسل من ملف التسلسل أو ملف البيانات الوصفية أو في الذاكرة

ssbio.databases.uniprot. blast_uniprot ( seq_str, seq_ident = 1, التقييم = 0.0001, review_only = صحيح, كائن حي = لا شيء ) [مصدر] ¶

قم بتفجير UniProt db للعثور على المعرفات التي تطابق إدخال التسلسل

  • seq_str - سلسلة التسلسل
  • seq_ident - هوية النسبة المئوية للمطابقة
  • تقييم - القيمة الإلكترونية لضربة الانفجار

ssbio.databases.uniprot. download_uniprot_file ( uniprot_id, نوع الملف, outdir = ", force_rerun = خطأ ) [مصدر] ¶

قم بتنزيل ملف UniProt لمعرف UniProt / ACC

  • uniprot_id - معرف UniProt صالح
  • نوع الملف - txt أو fasta أو xml أو rdf أو gff
  • outdir - دليل لتحميل الملف

احصل على تسلسل البروتين لمعرف UniProt كسلسلة.

العوامل:uniprot_id - معرف UniProt صالح
عائدات:سلسلة من تسلسل البروتين (الأحماض الأمينية)
نوع الإرجاع:شارع
ssbio.databases.uniprot. is_valid_uniprot_id ( ربط ) [مصدر] ¶

تحقق مما إذا كانت السلسلة هي معرف UniProt صالح.

العوامل:ربط - أي معرف سلسلة

إرجاع: صواب إذا كانت السلسلة معرف UniProt صالح

ssbio.databases.uniprot. old_parse_uniprot_txt_file ( شرير ) [مصدر] ¶

من: boscoh / uniprot github يوزع نص البيانات الوصفية المسترجعة من موقع uniprot.org.

تم تحليل عدد قليل من الحقول فقط ، ولكن هذا يوفر نموذجًا للحقول الأخرى.

يتم إنشاء وصف واحد من الانضمام إلى الأوصاف البديلة.

يقوم بإرجاع قاموس باستخدام مفتاح UNIPROT ACC الرئيسي كمفاتيح.

ssbio.databases.uniprot. parse_uniprot_txt_file ( شرير ) [مصدر] ¶

تحليل ملف بيانات أولية UniProt وإرجاع القاموس.

العوامل:شرير - مسار ملف البيانات الوصفية
عائدات:قاموس البيانات الوصفية
نوع الإرجاع:قاموس
ssbio.databases.uniprot. parse_uniprot_xml_metadata ( ريال سعودى ) [مصدر] ¶

قم بتحميل السمات ذات الصلة و dbxrefs من ملف UniProt XML الذي تم تحليله في SeqRecord.

عائدات:كافة المعلومات المحللة
نوع الإرجاع:قاموس
ssbio.databases.uniprot. uniprot_ec ( uniprot_id ) [مصدر] ¶

استرجع التعليق التوضيحي لرقم EC لمعرف UniProt.

العوامل:uniprot_id - معرف UniProt صالح

ssbio.databases.uniprot. uniprot_reviewed_checker ( uniprot_id ) [مصدر] ¶

تحقق مما إذا تمت مراجعة معرف UniProt واحد أم لا.

العوامل:uniprot_id
عائدات:إذا تمت مراجعة الإدخال
نوع الإرجاع:منطقي
ssbio.databases.uniprot. uniprot_reviewed_checker_batch ( uniprot_ids ) [مصدر] ¶

تحقق دفعة واحدة إذا تمت مراجعة معرفات uniprot أم لا

العوامل:uniprot_ids - معرف UniProt أو قائمة معرفات UniProt
عائدات:قيمة منطقية>
نوع الإرجاع:قاموس <>
ssbio.databases.uniprot. uniprot_sites ( uniprot_id ) [مصدر] ¶

استرجع قائمة بمواقع UniProt التي تم تحليلها من ملف الميزة

العوامل:uniprot_id - معرف UniProt صالح

KEGGProp¶

قم بتنزيل تسلسل FASTA للبروتين من قاعدة بيانات KEGG وأعد المسار.

  • gene_id - معرف الجين
  • outdir - مسار اختياري لدليل الإخراج

قم بتنزيل ملف KEGG المسطح لمعرف KEGG وأعد المسار.

  • gene_id - معرّف جين KEGG (مع رمز الكائن الحي) ، أي "eco: 1244"
  • outdir - دليل الإخراج الاختياري للبيانات الوصفية

تعيين جميع معرفات الجينات للكائن الحي لقاعدة البيانات الهدف.

هذا أسرع من توفير قائمة محددة من الجينات لتعيينها ، بالإضافة إلى أنه يبدو أن هناك حدًا للرقم الذي يمكنك تعيينه باستخدام استعلام REST اليدوي على أي حال.

  • organism_code - رمز KEGG المكون من ثلاثة أحرف لكائنك
  • target_db - بروتينيد ncbi | ncbi- جينيد | uniprot

تحليل ملف KEGG المسطح وإرجاع قاموس البيانات الوصفية.

مفاتيح القاموس هي: تصنيف refseq uniprot pdbs

العوامل:شرير - المسار إلى ملف KEGG المسطح
عائدات:قاموس البيانات الوصفية
نوع الإرجاع:قاموس


كيفية استرداد قائمة أسماء الجينات الكاملة ومعرفات جينات Entrez ومعلومات الشرح الأخرى من قائمة أسماء الجينات HUGO (في R أو أي منها)؟ - مادة الاحياء

HUGO: قاعدة بيانات تسمية الجينات البشرية (هينكستون ، المملكة المتحدة)
توفر أداة البحث في قاعدة بيانات تسمية الجينات البشرية الوصول إلى قائمة رموز الجينات البشرية المعتمدة حاليًا والتي تحتفظ بها لجنة التسميات الجينية HUGO. يتم أيضًا سرد العديد من الرموز المعتمدة مسبقًا ، مع روابط توجه المستخدمين إلى الرمز الحالي. قد لا يتم سرد التغييرات الطفيفة على رمز تمت الموافقة عليه مسبقًا ، مثل إضافة رقم (على سبيل المثال ، NRAMP يصبح NRAMP1) ، لذلك يجب على المستخدمين تجربة البحث "يبدأ الرمز بـ" باستخدام الأحرف القليلة الأولى من الرمز ، بدلاً من بحث دقيق ، إذا فشلوا في العثور على رمز معين. يتم جمع الرموز الأخرى المستخدمة في الأدبيات (المعروفة باسم الأسماء المستعارة) وتخزينها بواسطة لجنة HUGO Nomenclature ، وهي الآن قابلة للبحث باستخدام هذه الأداة. قد تكون ميزة "البحث عن جين" في GDB مفيدة للبحث عن أسماء / رموز أخرى لا يمكن العثور عليها في قاعدة بيانات تسمية الجينات البشرية.

التصنيف الدولي لأمراض الأورام ، الإصدار الثالث (ICD-O-3) (منظمة الصحة العالمية ، IARC ، ليون ، فرنسا)
الغرض / التعريف
تستخدم بشكل أساسي في سجلات الأورام أو السرطان لترميز الموقع (الطبوغرافيا) والأنسجة (مورفولوجيا) الأورام ، وعادة ما يتم الحصول عليها من تقرير علم الأمراض.
هيكل التصنيف
تصنيف متعدد المحاور للموقع ، مورفولوجيا ، سلوك ، وتصنيف الأورام.
يستخدم محور الطبوغرافيا التصنيف الدولي للأورام -10 للأورام الخبيثة (باستثناء تلك الفئات التي تتعلق بالأورام الثانوية وأنواع الأورام المورفولوجية المحددة) لجميع أنواع الأورام ، مما يوفر تفاصيل موقع أكبر للأورام غير الخبيثة مما هو منصوص عليه في التصنيف الدولي للأورام -10. على عكس ICD-10 ، يتضمن ICD-O طبوغرافيا لمواقع الأورام المكونة للدم والأورام الشبكية.
يوفر محور التشكل أكواد مكونة من خمسة أرقام تتراوح من M-8000/0 إلى M-9989/3. تشير الأرقام الأربعة الأولى إلى المصطلح النسيجي المحدد. الرقم الخامس بعد الشرطة المائلة (/) هو رمز السلوك ، والذي يشير إلى ما إذا كان الورم خبيثًا أو حميدًا أو موضعيًا أو غير مؤكد (سواء كان حميدًا أو خبيثًا).
يتم أيضًا توفير رمز منفصل مكون من رقم واحد للتصنيف النسيجي (التمايز).

بوابة بيانات ICGC (أونتاريو ، كاليفورنيا)
توفر بوابة بيانات ICGC أدوات لتصور البيانات الصادرة كل ثلاثة أشهر والاستعلام عنها وتنزيلها بواسطة المشاريع الأعضاء في الاتحاد. o
دراسة تحليل بانسر للجينوم الكامل (PCAWG) هي تعاون دولي لتحديد الأنماط الشائعة للطفرات في أكثر من 2800 جينوم كامل للسرطان من الاتحاد الدولي لجينوم السرطان.

TCGA cBIOPortal (MSKCC ، New_York ، الولايات المتحدة)
يوفر بوابة cBioPortal لعلم الجينوم السرطاني تصوراً وتحليلًا وتنزيلًا لمجموعات بيانات الميكروفونات الجينية السرطانية واسعة النطاق.

بوابة الورم الواسعة (معهد برود ، بوسطن ، الولايات المتحدة)
استكشف مجموعة البيانات حسب أنواع الأورام: الجينات ، والسرطانات ، وطفرات الحمض النووي ، والتعليقات التوضيحية

Firebrowse Broad GDAC (معهد برود ، بوسطن ، الولايات المتحدة)
استكشف مجموعة بيانات TCGA و Broad حسب مجموعة الورم باستخدام أنواع مختلفة من التحليلات: السريرية ، وعدد النسخ ، والارتباط ، و miR ، و mRNA ، والطفرة ، والمسارات ، و RPPA ..

في علم الجينوم التكاملي Onco (برشلون ، إيس)
قاعدة بيانات سائق السرطان الطفري

بوابة الواحة (شركة فايزر ، الولايات المتحدة)
OASIS هي بوابة ويب مفتوحة الوصول تمكن الباحثين في مجال السرطان من إجراء تحليلات استكشافية وتكاملية للطفرة الجسدية وتغييرات رقم النسخ (CNV) وبيانات التعبير الجيني من آلاف الأورام والأنسجة الطبيعية وخطوط الخلايا التي تمثل طيفًا واسعًا من الأورام الخبيثة.
تم تطوير OASIS بواسطة علم الأحياء الحسابي لبحوث الأورام من شركة Pfizer بالتعاون مع Research Business Technology (RBT). يرجى الاستشهاد بـ "OASIS: منصة على شبكة الإنترنت للتحليل الاستكشافي لجينوم السرطان وبيانات النسخ (المخطوطة قيد الإعداد)" عند نشر النتائج بناءً على OASIS.

متصفح السرطان UCSC (سان دييغو ، الولايات المتحدة)
يتيح متصفح UCSC Cancer للباحثين استكشاف بيانات جينوم السرطان والمعلومات السريرية المرتبطة بها بشكل تفاعلي. يمكن عرض البيانات بعدة طرق ، بما في ذلك حسب القيمة أو موقع الكروموسوم أو الميزة السريرية أو المسار البيولوجي أو مجموعة الجينات ذات الأهمية. من الممكن أيضًا إجراء التحليل الإحصائي بسرعة وعرضه بسهولة على مجموعات فرعية من البيانات.

كندا (ICR ، المملكة المتحدة)
canSAR هي قاعدة معرفية متكاملة تجمع بين بيانات متعددة التخصصات عبر علم الأحياء والكيمياء والصيدلة والبيولوجيا الهيكلية والشبكات الخلوية والشروح الإكلينيكية ، وتطبق مناهج التعلم الآلي لتوفير تنبؤات مفيدة لاكتشاف الأدوية.
هدف canSAR هو تمكين البحث الانتقالي للسرطان واكتشاف الأدوية من خلال توفير هذه المعرفة للباحثين من مختلف التخصصات. يوفر بوابة معلومات واحدة للإجابة على أسئلة التخصصات المعقدة ، بما في ذلك - من بين أشياء أخرى كثيرة: ما هو معروف عن البروتين ، وفيه يتم التعبير عن السرطانات أو تحورها وما هي الأدوات الكيميائية ونماذج الخط الخلوي التي يمكن استخدامها للتحقيق تجريبيًا في البروتين. نشاط؟ ما هو معروف عن دواء ، وملف حساسيته الخلوية وما هي البروتينات التي يُعرف ارتباطها والتي قد تفسر نشاطًا حيويًا غير عادي؟

السرطان (لا شاريت ، برلين ، دي)
قاعدة بيانات CancerResource. إنها قاعدة معرفية شاملة للعلاقات المستهدفة للعقاقير المتعلقة بالسرطان وكذلك لدعم المعلومات أو البيانات التجريبية. علاوة على ذلك ، يتم دمج بيانات جينوم السرطان على نطاق واسع في قاعدة بيانات CancerResource بما في ذلك تعبير mRNA وبيانات الطفرات غير المترادفة. لذلك ، يسمح CancerResource بتحليل البيانات الاستكشافية بناءً على التفاعلات المتعلقة بالسرطان مع أهداف الأدوية والتعبير وبيانات الطفرات بالإضافة إلى بيانات حساسية الدواء.

Entrez_Gene (NCBI ، Bethesda ، الولايات المتحدة)
Entrez_Gene هو جزء من Entrez مخصص للبحث عن المعلومات حول الجينات والروابط إلى قاعدة بيانات أخرى مثل RefSeq ، والخرائط ، و OMIM ، و Unigene ، و Pubmed. تم تطويره وصيانته بواسطة NCBI.

EnSembl (Sanger_EBI ، هينكستون ، المملكة المتحدة)
ينتج مشروع Ensembl قواعد بيانات الجينوم للفقاريات وأنواع حقيقية النواة الأخرى ، ويجعل هذه المعلومات متاحة مجانًا على الإنترنت

GeneCards: الجينات البشرية والبروتينات والأمراض (وايزمان ، رحوفوت ، إيس)
GeneCards هي قاعدة بيانات للجينات البشرية ومنتجاتها ومشاركتها في الأمراض. يقدم معلومات موجزة عن وظائف جميع الجينات البشرية التي لها رمز معتمد ، بالإضافة إلى أخرى مختارة [قائمة الجينات]. إنه مفيد بشكل خاص لأولئك الذين يبحثون عن معلومات حول مجموعات كبيرة من الجينات أو البروتينات ، على سبيل المثال. للعلماء العاملين في الجينوميات الوظيفية والبروتيوميات.

ايسفيو (NCBI ، Bethesda ، الولايات المتحدة)
يقدم AceView شرحًا توضيحيًا شاملاً وغير مكرر يدعم cDNA للجينات البشرية والديدان الخيطية. يشترك برنامجنا في محاذاة مليون mRNAs و ESTs المتاحة من GenBank و dbEST و RefSeq على تسلسل الجينوم ، ويقوم بتصفية جودة cDNAs وتجميعها في نسخ بديلة من الجينات d. من خلال البناء ، يتم رفع الدقة التعاونية لهذه التسلسلات ، ESTs أو mRNAs ، إلى الجودة الاستثنائية لتسلسل الجينوم.

جيناتلاس (تخيل ، باريس ، الاب)
تجمع قاعدة بيانات GENATLAS المعلومات ذات الصلة بجهود رسم الخرائط لمشروع الجينوم البشري. يتم جمع هذه المعلومات من المقالات الأصلية في الأدبيات أو من وقائع ورش عمل رسم خرائط الجينات البشرية والكروموسوم الفردي. يتم إعادة سرده في ثلاثة أدلة تفاعلية GENATLAS / GEN و GENATLAS / LINK و GENATLAS / REF. سلسلة من الخرائط الرسومية GENATLAS / MAP مرتبطة بالإضافة إلى قاعدة بيانات الخرائط المقارنة التي تم تحريرها بواسطة John H Edwards.

WikiGenes
WikiGenes هي مبادرة غير ربحية لتوفير قاعدة معرفية تعاونية عالمية لعلوم الحياة ، حيث يكون التأليف مهمًا. ابحث في آلاف الجينات والمواد الكيميائية والأمراض وأكثر من ذلك بكثير.

مصدر (برينستون ، الولايات المتحدة)
يحتوي المصدر على نوعين من الصفحات ، تقارير الجينات وتقارير CloneR. تعرض التقارير الجينية معلومات حول الجينات بما في ذلك البيانات الوظيفية والهيكلية والتعبيرية. تقدم GeneReports نظرة عامة على بيولوجيا الجين من خلال وصف وظيفتها البروتينية ، ومصادر الأنسجة لاستنساخ cDNA المرتبطة بالجين ، والصلات بتجارب المصفوفة الدقيقة التي تضمنت الجين المطلوب ، ورسم خرائط الجين داخل الجينوم البشري.
تعرض CloneReports معلومات حول استنساخ معين لـ cDNA (يُعرف أيضًا باسم Expressed Sequence Tag أو EST) بما في ذلك المعرف المفترض ، وحجم الإدراج ، ومعلومات المتجه ، والارتباطات إلى عمليات بحث BLAST وأدوات تصفح الجينوم. يمكن للمستخدمين التبديل بين نوعي التقارير بالنقر فوق الزر الموجود أعلى كل صفحة تقرير.

GHR مرجع المنزل الوراثي (بيثيسدا ، الولايات المتحدة)
يوفر Genetics Home Reference معلومات صديقة للمستهلك حول تأثيرات التباين الجيني على صحة الإنسان.

قاعدة مير (هينكستون ، المملكة المتحدة)
miRBase: قاعدة بيانات microRNA
يوفر miRBase الخدمات التالية:
قاعدة بيانات miRBase هي قاعدة بيانات قابلة للبحث لتسلسلات miRNA المنشورة والتعليقات التوضيحية. يمثل كل إدخال في قاعدة بيانات تسلسل miRBase جزءًا من دبوس الشعر المتوقع من نسخة miRNA (يُطلق عليها اسم mir في قاعدة البيانات) ، مع معلومات عن موقع وتسلسل تسلسل miRNA الناضج (يُسمى miR). يتوفر كل من دبوس الشعر والمتواليات الناضجة للبحث والتصفح ، ويمكن أيضًا استرداد الإدخالات بالاسم والكلمة الرئيسية والمراجع والتعليقات التوضيحية. جميع بيانات التسلسل والتعليقات التوضيحية متاحة أيضًا للتنزيل.
يوفر سجل miRBase لصيادي الجينات ميرنا أسماء فريدة لجينات ميرنا الجديدة قبل نشر النتائج. قم بزيارة صفحات المساعدة للحصول على مزيد من المعلومات حول خدمة التسمية.

dbDEMC2.0 (Cn)
قاعدة بيانات من miRNAs المعبر عنها تفاضليًا في السرطانات البشرية (الإصدار 2.0)
dbDEMC (قاعدة بيانات MiRNAs المعبر عنها تفاضليًا في السرطانات البشرية) هي قاعدة بيانات متكاملة مصممة لتخزين وعرض microRNAs المعبر عنها تفاضليًا (miRNAs) في السرطانات البشرية المكتشفة بواسطة طرق عالية الإنتاجية. في هذا الإصدار المحدث من dbDEMC ، تم جمع ما مجموعه 209 مجموعات بيانات منشورة حديثًا من Gene Expression Omnibus (GEO) و The Cancer Genome Atlas (TCGA).

H-InvDB (جا)
قاعدة بيانات متكاملة لقاعدة بيانات الجينات البشرية المشروحة H-Invitational Database (H-InvDB) هي قاعدة بيانات متكاملة للجينات البشرية والنصوص. من خلال تحليلات مكثفة لجميع النصوص البشرية ، نقدم تعليقات توضيحية منسقة للجينات البشرية والنصوص التي تشمل الهياكل الجينية ، ومتغيرات الربط البديلة ، و RNAs الوظيفية غير المشفرة ، ووظائف البروتين ، والمجالات الوظيفية ، والتوطين الخلوي الفرعي ، والمسارات الأيضية ، وبنية البروتين ثلاثية الأبعاد ، تعدد الأشكال الجينية (SNPs ، indels وتكرار الأقمار الصناعية الدقيقة) ، العلاقة مع الأمراض ، التنميط الجيني للتعبير ، والسمات التطورية الجزيئية ، تفاعلات البروتين البروتين (PPIs) وعائلات / مجموعات الجينات. تم إنتاج H-InvDB بواسطة "مشروع تكامل معلومات الجينوم" (2005-2008) استنادًا إلى تقنية التعليق التوضيحي التي تم إنشاؤها في مشروع H-Invitational للتعليق التوضيحي لـ cDNAs البشرية كاملة الطول ، وتم تقديمها كقاعدة بيانات رئيسية متكاملة للجينات البشرية في مشروع قاعدة البيانات المتكاملة METI (2008-).

GoldenPath: مسودة عمل لمشروع الجينوم البشري - متصفح الجينوم البشري (سان دييغو ، الولايات المتحدة)
تحتوي هذه الصفحة على روابط لتجميع المسودة الحالية للجينوم البشري. الجينوم البشري ما يقرب من 3.1 مليار قاعدة. تم ترتيب 88٪ تقريبًا من الجينوم بواسطة مشروع الجينوم البشري الدولي. تتكون مسودة الجينوم في السابع من أكتوبر من مئات الآلاف من الأجزاء ذات الأحجام المختلفة. غالبًا ما يكون ترتيب الأجزاء واتجاهها غير معروفين من عملية التسلسل نفسها. في بعض الحالات ، يتم تكرار نفس الجزء من الجينوم في عدة أجزاء.
متصفح الجينوم البشري

عرض الخريطة (NCBI ، Bethesda ، الولايات المتحدة)
يوفر Map Viewer إمكانيات تصفح خاصة لمجموعة فرعية من الكائنات الحية في Entrez Genomes. يتم عرض المجموعة الفرعية للكائن أدناه وأيضًا في الصفحة الرئيسية لـ Map Viewer. يتيح لك Map Viewer عرض الجينوم الكامل للكائن الحي والبحث فيه ، وعرض خرائط الكروموسوم ، والتكبير إلى مستويات أكبر من التفاصيل بشكل تدريجي ، وصولاً إلى بيانات التسلسل لمنطقة الاهتمام. يختلف عدد وأنواع الخرائط المتاحة حسب الكائن الحي ، ويتم وصفها في ملف "البيانات ونصائح البحث" لكل كائن حي. إذا توفرت خرائط متعددة للكروموسوم ، فإنها تعرضها متماشية مع بعضها البعض بناءً على العلامات المشتركة وأسماء الجينات ، وبالنسبة لخرائط التسلسل ، بناءً على نظام إحداثيات تسلسل مشترك.

EnSembl: مسودة عمل مشروع الجينوم البشري - عرض خريطة المجموعة (Sanger_EBI ، هينكستون ، المملكة المتحدة)
Ensembl هو مشروع مشترك بين EMBL-EBI ومركز Sanger لتطوير نظام برمجي ينتج ويحافظ على التعليقات التوضيحية التلقائية على جينومات حقيقية النواة.

مشروع جينكود (معهد سانجر ، هينكستون ، المملكة المتحدة)
أطلق المعهد القومي لبحوث الجينوم البشري (NHGRI) اتحادًا بحثيًا عامًا باسم ENCODE ، موسوعة عناصر الحمض النووي ، في سبتمبر 2003 ، لتنفيذ مشروع لتحديد جميع العناصر الوظيفية في تسلسل الجينوم البشري. بعد مرحلة تجريبية ناجحة على 1٪ من الجينوم ، يجري الآن توسيع نطاق الجينوم بأكمله. حصل معهد Wellcome Trust Sanger على منحة لتنفيذ توسيع نطاق مشروع GENCODE للتعليق التوضيحي المتكامل للميزات الجينية.
بعد أن شاركت بنجاح في تقديم التعليق التوضيحي النهائي للعناصر الوظيفية في الجينوم البشري ، حصلت مجموعة GENCODE على منحة ثانية في عام 2013 من أجل مواصلة عمل شرح الجينوم البشري وتوسيع GENCODE لتشمل شرحًا لجينوم الفأر.
يتم استخدام مجموعات الجينات GENCODE من قبل اتحاد ENCODE بالكامل والعديد من المشاريع الأخرى (مثل 1000 جينوم) كمجموعات جينات مرجعية.

> قاعدة المناعة
ImmunoBase هو مورد على شبكة الإنترنت يركز على علم الوراثة وعلم الجينوم للأمراض البشرية ذات الصلة بالمناعة. مهمتنا هي توفير مجموعة منسقة ومتكاملة من مجموعات البيانات والأدوات ، عبر أمراض متعددة ، لدعم وتعزيز البحث في هذا المجال.

فيجا: مسودة عمل لمشروع الجينوم البشري - عرض خريطة المجموعة (معهد سانجر ، هينكستون ، المملكة المتحدة)
Ensembl هو مشروع مشترك بين EMBL-EBI ومركز Sanger لتطوير نظام برمجي يولد النواتج ويحافظ على التعليقات التوضيحية التلقائية على جينومات حقيقية النواة.

عارض بيانات الجينوم: (NCBI ، Bethesda ، الولايات المتحدة)
عارض بيانات الجينوم NCBI (GDV) هو متصفح للجينوم يدعم استكشاف وتحليل مجموعات جينوم RefSeq حقيقية النواة. يسمح للمستخدمين بتصور أنواع مختلفة من البيانات المرتبطة بالتسلسل في سياق الجينوم. يتم استخدام Genome Data Viewer أيضًا بواسطة موارد NCBI مختلفة ، مثل GEO ، لعرض مجموعات البيانات المرتبطة بتجارب أو عينات محددة في سياق متصفح الجينوم. تتوفر ملاحظات الإصدار لكل إصدار من إصدارات المتصفح ، مع وصف الميزات الجديدة وإصلاحات الأخطاء. تتوفر مقاطع الفيديو في قائمة تشغيل GDV لمساعدتك على بدء استخدام ميزات المتصفح المختلفة.

Unigene (NCBI ، Bethesda ، الولايات المتحدة)
UniGene هو نظام تجريبي لتقسيم تسلسلات GenBank تلقائيًا إلى مجموعة غير متكررة من العناقيد الموجهة الجيني. تحتوي كل مجموعة UniGene على تسلسلات تمثل جينًا فريدًا ، بالإضافة إلى المعلومات ذات الصلة مثل أنواع الأنسجة التي تم التعبير عن الجين فيها ورسم خريطة للموقع.

GenBank (NCBI ، Bethesda ، الولايات المتحدة)
GenBank هي قاعدة بيانات المعاهد الوطنية للصحة لجميع متواليات النيوكليوتيدات والبروتينات المعروفة بما في ذلك دعم المعلومات الببليوغرافية والبيولوجية. منذ عام 1992 كان مقره في المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) ، وهو قسم من المكتبة الوطنية للطب ، ويقع في حرم المعاهد الوطنية للصحة. تم إنشاء NCBI من قبل الكونجرس في عام 1988 وتم تكليفه بشكل خاص بتطوير أنظمة المعلومات الآلية لدعم البيولوجيا الجزيئية والتكنولوجيا الحيوية. تتمثل مهمتها الأخرى في إجراء البحوث الأساسية وكجزء من برنامج NIH Intramural ، يواصل علماء NCBI البحث في تحليل الجينوم ، ونمذجة الهيكل الجزيئي والتنبؤ ، والطرق الرياضية لتحليل التسلسل.

المرجع (NCBI ، Bethesda ، الولايات المتحدة)
سيوفر مشروع التسلسل المرجعي NCBI (RefSeq) معايير تسلسل مرجعي للجزيئات التي تحدث بشكل طبيعي للعقيدة المركزية ، من الكروموسومات إلى mRNAs إلى البروتينات. توفر معايير RefSeq أساسًا للتعليق التوضيحي الوظيفي للجينوم البشري. أنها توفر نقطة مرجعية مستقرة لتحليل الطفرات ، ودراسات التعبير الجيني ، واكتشاف تعدد الأشكال.

CCDS (جامعة كاليفورنيا ، سان دييغو ، الولايات المتحدة)
مشروع CDS الإجماع (CCDS) هو جهد تعاوني لتحديد مجموعة أساسية من مناطق ترميز بروتين الإنسان والفأر التي يتم شرحها باستمرار وذات جودة عالية. الهدف طويل المدى هو دعم التقارب نحو مجموعة قياسية من التعليقات التوضيحية الجينية.

سريع- DB (جينوسبليس ، باريس ، فرنسا)
قاعدة بيانات الربط البديلة والنصوص الودية
FAST DB: مصدر موقع على شبكة الإنترنت لدراسة تنظيم التعبير عن منتجات الجينات البشرية.
يوفر Fast DB ثلاثة أنواع من التحليل: mRNAs البشرية ، و mRNAs البشرية و ESTs ، و mRNAs الفأرية.

ASG - معرض الربط البديل (NCSU ، الولايات المتحدة)
يتيح معرض الربط البديل للمستخدمين إنشاء رسوم بيانية للربط لجميع الجينات البشرية

أطلس التعبير الجيني ArrayExpress (EBI ، Hinxton ، المملكة المتحدة)
ArrayExpress Gene Expression Atlas عبارة عن قاعدة بيانات غنية بالمعنى المقصود لإحصاءات الملخص المستندة إلى التحليل التلوي على مجموعة su منسقة من ArrayExpress Archive ، وتخدم الاستعلامات لأنماط التعبير الجيني الخاصة بالظروف بالإضافة إلى البحث الاستكشافي الأوسع للجينات / العينات المثيرة للاهتمام بيولوجيًا.
للاستشهاد بالأطلس في بحثك أو لمعرفة المزيد عنه ، يرجى الرجوع إلى Kapushesky M et al. (2009) أطلس التعبير الجيني في المعهد الأوروبي للمعلومات الحيوية ، إصدار قاعدة بيانات أبحاث الأحماض النووية (NAR 2009)

ملامح GEO (NCBI ، Bethesda ، الولايات المتحدة)
تخزن قاعدة البيانات هذه ملفات تعريف التعبير الجيني الفردية من DataSets المنسقة في مستودع Gene Expression Omnibus (GEO). ابحث عن ملفات تعريف محددة للاهتمام بناءً على التعليقات التوضيحية الجينية أو خصائص الملف الشخصي المحسوبة مسبقًا.

طلب (برينستون ، الولايات المتحدة)
الاستكشاف المستند إلى البحث لخلاصة التعبير [الإنسان] SEEK هو محرك بحث عن التعبير الجيني الحسابي المشترك. يوفر SEEK لعلماء الأحياء طريقة للتنقل في خلاصة التعبير البشري الهائلة التي تحتوي الآن على الآلاف من مجموعات بيانات التعبير. تُرجع SEEK ترتيبًا قويًا للجينات التي يتم التعبير عنها بشكل مشترك في مجال الاهتمام البيولوجي المحدد بواسطة جينات استعلام المستخدم. في غضون ذلك ، يعطي أيضًا الأولوية لآلاف مجموعات بيانات التعبير وفقًا لاستعلام المستخدم الذي يثير اهتمامه. تشمل نقاط القوة الفريدة لـ SEEK دعمها للاستعلام متعدد الجينات والتحليل عبر الأنظمة الأساسية ، بالإضافة إلى ميزات التصور الغنية.

MEM - مصفوفة التجارب المتعددة (Est)
التعدين من أجل التعايش عبر مئات مجموعات البيانات باستخدام طرق تجميع الرتب الجديدة والتصور.

Genevestigator (نحن)
GENEVESTIGATOR : بيانات تعبير العالم في متناول يدك
وصف الجينات من خلال معرفة مكان وزمان والاستجابة لما يتم التعبير عنها
تعرف على المزيد من تجاربك من خلال دمجها ومقارنتها بمجموعات البيانات العامة
استكشف التجارب المنسقة بخبرة للعثور على أدلة داعمة لفرضياتك
اكتشف وحدد أولويات المؤشرات الحيوية والأهداف الخاصة بك مقابل آلاف الظروف

BIOGPS (سكريبس ، لنا)
بوابة شرح جيني مجانية قابلة للتوسيع وقابلة للتخصيص ، وهي مورد كامل للتعرف على وظيفة الجينات والبروتينات.

بوابة GTEX (برود ، بوسطن الولايات المتحدة)
ستساعد ارتباطات مشروع GTEx بين النمط الجيني ومستويات التعبير الجيني الخاص بالأنسجة في تحديد مناطق الجينوم التي تؤثر على ما إذا كان الجين يتم التعبير عنه ومقدار ذلك. ستساعد GTEx الباحثين على فهم القابلية الموروثة للإصابة بالأمراض وستكون قاعدة بيانات موارد وبنكًا للأنسجة للعديد من الدراسات في المستقبل. يهدف مشروع التعبير الوراثي عن الأنسجة (GTEx) إلى تزويد المجتمع العلمي بمورد يمكن بواسطته دراسة التعبير الجيني البشري وتنظيمه وعلاقته بالتنوع الجيني. سيقوم هذا المشروع بجمع وتحليل العديد من الأنسجة البشرية من المتبرعين الذين لديهم أيضًا تنميط جيني كثيف ، لتقييم التباين الجيني داخل جينوماتهم.من خلال تحليل تعبير الحمض النووي الريبي العالمي داخل الأنسجة الفردية ومعالجة مستويات التعبير عن الجينات كسمات كمية ، يمكن تحديد الاختلافات في التعبير الجيني التي ترتبط ارتباطًا وثيقًا بالتنوع الجيني على أنها مواضع سمات كمية التعبير ، أو eQTLs.

المريمية (NCBI ، Bethesda ، الولايات المتحدة)
من أجل دعم الاستخدام العام ونشر التحليل التسلسلي لبيانات التعبير الجيني (SAGE) ، قام NCBI مؤخرًا بتجديد هذا الموقع. SAGEmap هو مورد بيانات SAGE للاستعلام عن بيانات SAGE واسترجاعها وتحليلها من أي كائن حي. تم الوصول إلى جميع البيانات الموجودة على موقع الويب هذا في Gene Expressi في مستودع Omnibus

UniProt: قاعدة بيانات تسلسل البروتين (EBI ، Hinxton ، المملكة المتحدة)
تتمثل مهمة UniProt في تزويد المجتمع العلمي بمورد شامل وعالي الجودة ويمكن الوصول إليه مجانًا من تسلسل البروتين والمعلومات الوظيفية.

قاعدة بيانات تسلسل البروتين SwissProt (SIB، Geneve، Ch)
قاعدة بيانات تسلسل البروتين SWISS-PROT هي قاعدة بيانات لتسلسلات البروتين التي تم إنتاجها بشكل تعاوني بواسطة Amos Bairoch (جامعة جنيف) ومكتبة بيانات EMBL. البيانات الموجودة في Swiss-Prot مستمدة من ترجمات تسلسل الحمض النووي من قاعدة بيانات EMBL Nucleotide Sequencef ، المقتبسة من مجموعة موارد تحديد البروتين (PIR) ، المستخرجة من الأدبيات والمقدمة مباشرة من قبل الباحثين. يحتوي على تعليق توضيحي عالي الجودة ، وهو غير مكرر ، ومرجوع إلى العديد من قواعد البيانات الأخرى ، ولا سيما قاعدة بيانات تسلسل النوكليوتيدات EMBL وقاعدة بيانات نمط PROSITE و PDB. SWISS-PROT هي قاعدة بيانات منسقة لتسلسل البروتين تسعى جاهدة لتوفير مستوى عالٍ من التعليقات التوضيحية (مثل وصف وظيفة البروتين ، وهيكل المجال الخاص به ، والتعديلات اللاحقة للترجمة ، والمتغيرات ، وما إلى ذلك) ، والحد الأدنى من التكرار و مستوى عال من التكامل مع قواعد البيانات الأخرى. تشمل التطورات الأخيرة في قاعدة البيانات ما يلي: زيادة عدد ونطاق الكائنات الحية النموذجية والإحالات المرجعية إلى سبع قواعد بيانات إضافية ، ومجموعة متنوعة من ملفات التوثيق الجديدة. يتكون هذا الملحق من إدخالات في تنسيق يشبه SWISS-PROT مشتقة من ترجمة جميع تسلسلات التشفير (CDS) في قاعدة بيانات تسلسل النوكليوتيدات EMBL ، باستثناء الأقراص المدمجة المضمنة بالفعل في SWISS-PROT.

NextProt: استكشاف عالم البروتينات البشرية (SIB، Geneve، Ch)
تم تطوير neXtProt بالتعاون بين المعهد السويسري للمعلوماتية الحيوية SIB و Geneva Bioinformatics (GeneBio) SA ، وهو عبارة عن منصة اكتشاف شاملة تركز على الإنسان ، تقدم لمستخدميها تكاملًا سلسًا والتنقل عبر البيانات المتعلقة بالبروتين.

السويسري- VAR (SIB، Geneve، Ch)
SwissVar هي بوابة للبحث في المتغيرات في إدخالات Swiss-Prot لقاعدة المعرفة UniProt (UniProtKB) ، وتوفر وصولاً مباشرًا إلى صفحات Swiss-Prot Variant.
تلخص صفحات Swiss-Prot Variant جميع المعلومات المتعلقة بمتغير معين وتحتوي على:
شرح يدوي لعلاقة النمط الظاهري بالنمط الجيني لكل متغير محدد بناءً على المعلومات المحسوبة مسبقًا في الأدبيات (مثل درجات الحفظ وقائمة السمات الهيكلية عند توفرها) للمساعدة في تقييم تأثير المتغير

إنزيم (SIB، Geneve، Ch)
يحتوي بنك بيانات ENZYME على البيانات التالية لكل نوع من أنواع الإنزيم المميز الذي تم توفير رقم EC له: رقم EC ، الاسم الموصى به ، الأسماء البديلة ، النشاط التحفيزي ، العوامل المساعدة ، المؤشرات إلى مشروع (أو مشاريع) SWISS-PROT التي تتوافق مع الإنزيم ، مؤشرات المرض (الأمراض) المرتبطة بنقص الإنزيم.

إنتينز (المعهد الأوروبي للأعمال ، المملكة المتحدة)
IntEnz (قاعدة بيانات الإنزيم العلائقية المتكاملة) هي مورد متاح مجانًا يركز على تسمية الإنزيم. تم إنشاء IntEnz بالتعاون مع المعهد السويسري للمعلوماتية الحيوية (SIB). هذا التعاون مسؤول عن إنتاج مورد ENZYME. يحتوي IntEnz على توصيات لجنة التسمية التابعة للاتحاد الدولي للكيمياء الحيوية والبيولوجيا الجزيئية (NC-IUBMB) بشأن تسمية وتصنيف التفاعلات المحفزة بالإنزيم.

PhosPhoSitePlus (دنفرز ، الولايات المتحدة)
PhosphoSitePlus (PSP) هو مورد لبيولوجيا الأنظمة عبر الإنترنت يوفر معلومات وأدوات شاملة لدراسة تعديلات البروتين بعد الترجمة (PTMs) بما في ذلك الفسفرة والانتشار والأسيتيل والميثيل. انظر حول PhosphoSite أعلاه لمزيد من المعلومات.

الايجابيات: تواقيع البروتين (SIB، Geneve، Ch)
تتكون قاعدة بيانات PROSITE من مجموعة كبيرة من التوقيعات ذات المعنى البيولوجي التي يتم وصفها على أنها أنماط أو ملفات تعريف. يرتبط كل توقيع بالوثائق التي توفر معلومات بيولوجية مفيدة عن عائلة البروتين أو المجال أو الموقع الوظيفي المحدد بواسطة التوقيع. تمت إعادة تصميم صفحة الويب PROSITE وتم تنفيذ العديد من الأدوات لمساعدة المستخدم على اكتشاف مناطق محمية جديدة في البروتينات الخاصة به وتصور ترتيبات المجال. قدمنا ​​أيضًا وسيلة للبحث في PDB بإدخال PROSITE أو نمط المستخدم وتصور المواضع المتطابقة على الهياكل ثلاثية الأبعاد. يحتوي الإصدار الأخير من PROSITE (الإصدار 18.17 بتاريخ 30 نوفمبر 2003) على 1676 إدخالاً. يمكن الوصول إلى قاعدة البيانات على http://www.expasy.org/prosite/.

Interpro: (المورد المتكامل لمجالات البروتين والمواقع الوظيفية) (EBI ، Hinxton ، المملكة المتحدة)
تم إنشاء الإصدار 1.0 (مارس 2000) من Pfam 5.0 و PRINTS 25.0 و PROSITE 16 وبيانات SWISS-PROT + TrEMBL الحالية. يحتوي هذا الإصدار من InterPro على 2990 إدخالًا ، تمثل 2373 عائلة ، و 556 مجالًا ، و 47 تكرارًا و 14 موقعًا لتعديل ما بعد الترجمة تم ترميزها بواسطة 4884 تعبيرًا عاديًا مختلفًا ، وملفات تعريف ، وبصمات أصابع ، و HMMs.
تعد Interpro موردًا مفيدًا لتحليل الجينوم الكامل وقد تم استخدامه بالفعل لتحليل البروتينات لعدد من الكائنات الحية المتسلسلة تمامًا. كما تم إنتاج تحليل بروتيني أولي للجينوم البشري.

PFAM - مركز سانجر (سانجر ، هينكستون ، المملكة المتحدة)
Pfam عبارة عن مجموعة كبيرة من محاذاة التسلسل المتعددة ونماذج Markov المخفية التي تغطي العديد من مجالات البروتين الشائعة
Pfam عبارة عن مجموعة من مجموعات ومجالات البروتين. يحتوي Pfam على محاذاة بروتين متعددة وملف تعريف HMM لهذه العائلات. Pfam هي قاعدة بيانات عائلة بروتين شبه آلية ، تهدف إلى أن تكون شاملة ودقيقة. توفر هذه الصفحة ارتباطات إلى العديد من مستندات المساعدة المتوفرة.

CDD قاعدة بيانات المجال المحفوظة وخدمة البحث (NCBI ، Bethesda ، الولايات المتحدة)
غالبًا ما تحتوي البروتينات على عدة وحدات أو مجالات ، لكل منها أصل ووظيفة تطورية مميزة. يمكن استخدام خدمة البحث عن القرص المضغوط لتحديد المجالات المحفوظة الموجودة في تسلسل البروتين:
يحدد علماء الأحياء الحسابية المجالات المحفوظة بناءً على أنماط التسلسل المتكررة أو الزخارف. يحتوي CDD حاليًا على مجالات مشتقة من مجموعتين شائعتين ، Smart و Pfam ، بالإضافة إلى مساهمات من الزملاء في NCBI. توفر قواعد البيانات المصدر أيضًا أوصافًا وروابط للاستشهادات. نظرًا لأن المجالات المحفوظة تتوافق مع الوحدات الهيكلية المدمجة ، تحتوي الأقراص المضغوطة على روابط لهيكل ثلاثي الأبعاد عبر Cn3D كلما أمكن ذلك.

DMDM رسم خرائط مجال طفرات المرض (DMDM) (بالتيمور ، الولايات المتحدة)
رسم خرائط المجال لطفرات المرض (DMDM) هو قاعدة بيانات يمكن من خلالها عرض كل طفرة مرضية من خلال الجين أو البروتين أو موقع المجال. يوفر DMDM ​​عرضًا فريدًا على مستوى المجال حيث يتم تعيين جميع طفرات الترميز البشرية على مجال البروتين. لبناء DMDM ​​، تمت محاذاة جميع البروتينات البشرية إلى قاعدة بيانات لمجالات البروتين المحفوظة باستخدام أداة محاذاة التسلسل المستندة إلى نموذج ماركوف المخفي (HMMer). تم استخدام محاذاة مجال البروتين الناتجة لتوفير موقع مجال لجميع طفرات الأمراض البشرية المتاحة وتعدد الأشكال. يتم عرض عدد الطفرات المرضية وتعدد الأشكال في كل موضع مجال جنبًا إلى جنب مع المعلومات الوظيفية الأخرى ذات الصلة (على سبيل المثال ، نشاط الربط والتحفيز للموقع والحفاظ على موقع هذا المجال). يسلط عرض مجال البروتين في DMDM ​​الضوء على العلاقات الجزيئية بين الطفرات من أمراض مختلفة والتي قد لا يتم ملاحظتها بوضوح باستخدام أدوات التصور التقليدية المتمحورة حول الجينات.

المنتج (برابي ، ليون ، فرنسا)
ProDom عبارة عن مجموعة شاملة من عائلات مجال البروتين التي يتم إنشاؤها تلقائيًا من قواعد بيانات تسلسل SWISS-PROT و TrEMBL

PDB - قاعدة بيانات البروتين (سان دييغو ، الولايات المتحدة)
يوفر RCSB PDB مجموعة متنوعة من الأدوات والموارد لدراسة هياكل الجزيئات البيولوجية وعلاقاتها بالتسلسل والوظيفة والمرض

بدبسوم (EBI ، Hinxton ، المملكة المتحدة)
PDBsum هي قاعدة بيانات مصورة توفر نظرة عامة سريعة على كل بنية جزيئية كبيرة مودعة في بنك بيانات البروتين (PDB). يوفر مخططات تخطيطية للجزيئات في كل بنية وللتفاعلات بينها. يتم الوصول إلى الإدخالات عن طريق رمز PDB الخاص بهم ، أو عن طريق البحث النصي البسيط ، أو من خلال أي من خيارات التصفح الموجودة على اليسار.

IMB (جينا ، دي)
تهدف مكتبة Jena للجزيئات البيولوجية الكبيرة (JenaLib) إلى نشر أفضل للمعلومات حول هياكل البوليمر الحيوي ثلاثية الأبعاد مع التركيز على التصور والتحليل.

SBKB (روتجرز ، لنا)
توفر قاعدة المعرفة في علم الأحياء الإنشائية أحدث بيانات البحث والموارد ، ويسلط الضوء على البيولوجيا الهيكلية ومبادرة بنية البروتين.

سكوب (بيرليلي ، الولايات المتحدة)
SCOPe هي قاعدة بيانات تم تطويرها في Berkeley Lab و UC Berkeley والتي تعمل على توسيع نطاق SCOP (الإصدار 1). يصنف SCOPe العديد من الهياكل التي تم إصدارها منذ SCOP 1.75 من خلال مزيج من الأتمتة والمعالجة اليدوية ، ويصحح بعض الأخطاء ، بهدف الحصول على نفس الدقة مثل إصدارات SCOP المنسقة يدويًا بالكامل. يقوم SCOPe أيضًا بدمج وتحديث قاعدة البيانات Astral.

CATH (UCL ، لندن ، المملكة المتحدة)
CATH هو تصنيف لبنية البروتين تم تنزيله من PDB.

أطلس البروتين البشري (أبسالا ، سو)
يُظهر أطلس البروتين البشري تعبيرًا وتوطين البروتينات في مجموعة كبيرة ومتنوعة من الأنسجة البشرية الطبيعية والخلايا السرطانية وخطوط الخلايا بمساعدة صور الكيمياء المناعية (IHC) والصور المجهري البؤري المناعي (IF).

HPRD - قاعدة بيانات مرجعية للبروتين البشري (جون هوبكنز ، بالتيمور ، الولايات المتحدة)
تمثل قاعدة البيانات المرجعية للبروتين البشري منصة مركزية لتصوير ودمج المعلومات المتعلقة بهندسة المجال ، والتعديلات اللاحقة للترجمة ، وشبكات التفاعل ، وترابط الأمراض لكل بروتين في البروتين البشري. تم استخراج جميع المعلومات الموجودة في HPRD يدويًا من الأدبيات من قبل علماء الأحياء الخبراء الذين يقرأون ويفسرون ويحللون البيانات المنشورة. تم إنشاء HPRD باستخدام قاعدة بيانات موجهة للكائنات في Zope ، وهو خادم تطبيق ويب مفتوح المصدر ، يوفر تنوعًا في وظائف الاستعلام ويسمح بعرض البيانات ديناميكيًا.

تراجع (جامعة كاليفورنيا ، الولايات المتحدة)
تسرد قاعدة بيانات DIP (قاعدة بيانات البروتينات المتفاعلة) أزواج البروتين المعروفة بالتفاعل مع بعضها البعض. من خلال التفاعل ، نعني أنه تم تحديد سلسلتين من الأحماض الأمينية تجريبياً للارتباط ببعضهما البعض. تسرد قاعدة البيانات مثل هذه الأزواج لمساعدة أولئك الذين يدرسون تفاعل بروتين بروتين معين ولكن أيضًا أولئك الذين يبحثون في المسارات التنظيمية والإشارات بأكملها بالإضافة إلى أولئك الذين يدرسون تنظيم وتعقيد شبكة تفاعل البروتين على المستوى الخلوي.

IntAct - EBI (EBI ، Hinxton ، المملكة المتحدة)
يوفر IntAct نظام قاعدة بيانات مفتوح المصدر متاح مجانًا وأدوات تحليل لبيانات تفاعل البروتين. جميع التفاعلات مستمدة من معالجة الأدبيات أو عمليات إرسال المستخدم المباشرة وهي متاحة مجانًا.

فنكوب (KTH ، ستوكهولم ، سو)
FunCoup هو إطار إحصائي لتكامل البيانات لإيجاد اقتران وظيفي (FC) بين البروتينات. ينقل المعلومات من الكائنات الحية النموذجية (M. musculus ، D. melanogaster ، C. elegans ، S. cerevisiae وما إلى ذلك) عبر تقويم العظام الذي وجده برنامج InParanoid (Remm et al. ، 2001). يتم جمع بيانات من مصادر مختلفة وطبائع مختلفة ، مثل جهات الاتصال للبروتينات الكاملة والمجالات الفردية ، و mRNA وتعبير البروتين ، والتوطين في الأنسجة والمقصورات الخلوية ، واستهداف miRNA و TF ، وملفات تعريف النشوء والتطور المماثلة ، وما إلى ذلك ، وتقييمها احتماليًا في شبكة بايز. (BN) ، تم تدريبه على مجموعات من حالات FC المعروفة (مثل موارد KEGG أو IntAct أو HPRD أو GRID) مقابل مجموعات من أزواج البروتين المختارة عشوائيًا كمرجع للخلفية

بيوجريد (تورنتو ، كاليفورنيا)
المستودع العام البيولوجي لمجموعات بيانات التفاعل
BioGRID هو مستودع تفاعل عبر الإنترنت مع البيانات التي تم تجميعها من خلال جهود التنظيم الشاملة. فهرسنا الحالي هو الإصدار 3.1.78 ويبحث في 27283 منشورًا عن 402127 بروتين خام وتفاعلات وراثية من أنواع الكائنات الحية النموذجية الرئيسية. يتم توفير جميع بيانات التفاعل مجانًا من خلال فهرس البحث الخاص بنا ومتاحة عبر التنزيل في مجموعة متنوعة من التنسيقات الموحدة.

هذا هو المواد التي سوف تستخدم ( نحن)
مشروع علم الوجود الجيني هو مبادرة رئيسية للمعلوماتية الحيوية بهدف توحيد تمثيل الجينات وسمات المنتجات الجينية عبر الأنواع وقواعد البيانات. يوفر المشروع مفردات مسيطر عليها للمصطلحات لوصف خصائص منتج الجينات وبيانات شرح المنتج الجيني من أعضاء GO Consortium ، بالإضافة إلى أدوات للوصول إلى هذه البيانات ومعالجتها.

QuickGO (EBI ، Hinxton ، المملكة المتحدة)
متصفح سريع للمصطلحات والتعليقات التوضيحية لـ Gene Ontology.

Kegg (NCI) Kegg (كيوتو) موسوعة كيوتو للجينات والجينوم (كيوتو ، اليابان)
KEGG هو مورد قاعدة بيانات لفهم الوظائف والمرافق عالية المستوى للنظام البيولوجي ، مثل الخلية والكائن الحي والنظام البيئي ، من المعلومات على المستوى الجزيئي ، وخاصة مجموعات البيانات الجزيئية واسعة النطاق الناتجة عن تسلسل الجينوم وغيرها من الإنتاجية العالية التقنيات التجريبية (انظر ملاحظات الإصدار للميزات الجديدة والمحدثة).

رياكتوم (iOICR، ca، New-York، Us، EBI، UK)
REACTOME هي قاعدة بيانات مسارات مجانية ، على الإنترنت ، ومفتوحة المصدر ، ومنسقة تشمل العديد من مجالات البيولوجيا البشرية. يتم تأليف المعلومات من قبل باحثين بيولوجيين خبراء ، ويتم الاحتفاظ بها من قبل فريق التحرير في Reactome ويتم الرجوع إليها في مجموعة واسعة من قواعد البيانات البيولوجية القياسية.

NDEx (تبادل بيانات الشبكة) (جامعة كاليفورنيا ، الولايات المتحدة)
يتم تجميع التفاعلات الجزيئية الحيوية والعمليات الخلوية في مسارات إشارات بشرية موثوقة يشتمل خادم NDEx العام على عدد كبير من الشبكات التي تم تمييزها على أنها عامة وبالتالي يمكن الوصول إليها دون تسجيل الدخول إلى حساب مستخدم. يمكن العثور على الشبكات العامة وعرضها والاستعلام عنها بشكل مجهول باستخدام شريط البحث المتوفر في الصفحة المقصودة لخادم NDEx العام.

أطلس السرطان خريطة عالمية لشبكات الإشارات (كوري ، باريس ، فرنسا)
ACSN هي قاعدة بيانات مسار وبيئة قائمة على الويب تحتوي على مجموعة من خرائط شبكة الإشارات المرتبطة بالسرطان والمترابطة. تم تصوير آليات الإشارات الخلوية على الخرائط على مستوى التفاعلات الكيميائية الحيوية ، وتشكل شبكة كبيرة من 4600 تفاعل تغطي 1821 بروتينًا و 564 جينًا وتربط العديد من العمليات الخلوية الرئيسية. الأطلس هو "خريطة العالم" التفاعلية "الشبيهة بالجغرافيا" للتفاعلات الجزيئية المرتبطة بالسرطان.

مسارات ويكي
WikiPathways عبارة عن منصة عامة مفتوحة مخصصة لرعاية المسارات البيولوجية من قبل المجتمع العلمي ومن أجله.

OrthoDB الكتالوج الهرمي لأخصائيي تقويم حقيقيات النوى (جامعة جنيف ، الفصل)
يقدم OrthoDB كتالوجًا لجينات ترميز البروتين المتعامدة حقيقية النواة عبر 48 من الفقاريات و 33 مفصليات الأرجل و 73 فطريًا و 12 ميتازوانًا قاعديًا. يشير علم تقويم العظام إلى آخر سلف مشترك للأنواع قيد الدراسة ، وبالتالي فإن OrthoDB يحدد بوضوح أخصائيي تقويم العظام عند كل إشعاع على طول سلالة الأنواع

هوجينوم (ليون 1 ، فرنسا)
HOGENOM هي قاعدة بيانات للجينات المتماثلة من الكائنات الحية المتسلسلة بالكامل ، وهي منظمة وفقًا لنظام إدارة قاعدة بيانات التسلسل ACNUC. يسمح للمرء بتحديد مجموعات من الجينات المتماثلة بين الأنواع ، وتصور المحاذاة المتعددة وأشجار النشوء والتطور. وبالتالي فإن HOGENOM مفيد بشكل خاص في تحليل التسلسل المقارن ، ودراسات التطور الجزيئي والتطور. بشكل عام ، يعطي HOGENOM نظرة شاملة لما هو معروف عن عائلة الجينات الغريبة.

متجانس (NCBI ، Bethesda ، الولايات المتحدة)
HomoloGene هو نظام للكشف الآلي عن المتماثلات بين الجينات المشروحة للعديد من جينومات حقيقيات النوى المتسلسلة بالكامل.

TREEFAM: قاعدة بيانات عائلات الشجرة (EBI ، Hinxton ، المملكة المتحدة)
TreeFam (قاعدة بيانات عائلات الأشجار) هي قاعدة بيانات لأشجار النشوء والتطور للجينات الحيوانية. ويهدف إلى تطوير مورد منظم يقدم معلومات موثوقة حول مهام تقويم العظام والبارالوج ، والتاريخ التطوري لعائلات الجينات المختلفة

فارز الجينات (جامعة كاليفورنيا ، سان دييغو ، الولايات المتحدة)
فارز الجينات UCSC هو مورد ممتاز لاستكشاف عائلات الجينات والعلاقات بين الجينات. تعرض هذه الأداة جدول الجينات داخل جينوم محدد مرتبط ببعضه البعض. يمكن استكشاف العديد من العلاقات المختلفة: التماثل على مستوى البروتين ، والتشابه في ملامح التعبير الجيني ، أو القرب الجيني. يدعم Gene Sorter البحث عن مجموعة متنوعة من المصطلحات والعبارات ، بما في ذلك اسم الجين أو اسم بروتين SwissProt أو انضمام GenBank أو كلمة أو عبارة موجودة في وصف الجين. يعد عرض عائلة الجينات قابلاً للتكوين بدرجة كبيرة ، مما يسمح للمستخدم بالتحكم في ترتيب الأعمدة وعددها وعدد الصفوف والجينات المعروضة. توفر الأداة العديد من تنسيقات الإخراج ، بما في ذلك تنسيق بسيط محدد بعلامات جدولة يمكن استيراده إلى جدول بيانات أو قاعدة بيانات علائقية.

InParanoid (ستوكهولم ، سو)
InParanoid: مجموعات تقويم حقيقيات النوى

كوزميك (مركز سانجر ، هينكستون ، المملكة المتحدة)
تنشأ جميع السرطانات نتيجة لاكتساب سلسلة من التشوهات الثابتة في تسلسل الحمض النووي ، والطفرات ، والتي يمنح الكثير منها في النهاية ميزة نمو للخلايا التي حدثت فيها. هناك قدر هائل من المعلومات المتاحة في المؤلفات العلمية المنشورة حول هذه التغييرات. تم تصميم COSMIC لتخزين وعرض معلومات الطفرات الجسدية والتفاصيل ذات الصلة ، ويحتوي على معلومات تتعلق بالسرطانات البشرية.

TICdb (جامعة نافار ، إسبانيا)
يمكنك البحث في TICdb باستخدام أي اسم جيني مستعار متاح في Entrez Gene. لكل اندماج يشارك فيه هذا الجين ، سيعيد TICdb اسم HGNC لكل من الجينات الشريكة والمرجع الأصلي (إما GenBank أو معرف Pubmed) ، بالإضافة إلى تسلسل الاندماج.

TCGA Fusion Portal MDACC (MDACC ، هيوستن ، الولايات المتحدة)
بوابة بيانات الجينات TCGA Fusion (منظر مركز MD Anderson للسرطان للاندماج المرتبط بالسرطان باستخدام خط الأنابيب لتحليل بيانات تسلسل الحمض النووي الريبي
تتوافق عمليات اندماج الجينات مع الجدول 4 (المستوى 1 و 2) من الورقة:
المنظر الطبيعي والأهمية العلاجية لعمليات اندماج النسخ المرتبطة بالسرطان. ك يوشيهارا وآخرون. (2014) Oncogene، 1-10.

فيوجن كانسر (بكين) (بكين ، كندا)
منذ فترة طويلة تم التعرف على تسلسل mRNA من الجيل التالي (RNA-seq) كأداة فعالة في تحليل النسخ الديناميكي. يمكن أن يوفر ليس فقط تغطية أساسية متزايدة ، ولكن أيضًا إنتاجية أعلى للعينة.إنه يسهل القدرة على البحث عن نصوص بديلة مقسمة ، وتعديلات ما بعد النسخ ، واندماج الجينات ، والطفرات / SNPs والتغييرات في عرض الجينات. تم إنشاء العديد من قواعد البيانات لأبحاث الكشف عن الجينات الاندماجية ، مثل قاعدة بيانات ميتيلمان للانحراف الكروموسومي والاندماج الجيني في السرطان و ChimerDB. لكنها مشتقة إما من التجارب أو تسلسل النصوص ، التي تحتوي على سجلات متقنة. توفر الكمية الهائلة من بيانات تسلسل الحمض النووي الريبي التي تم إنتاجها في السنوات القليلة الماضية موارد وفيرة في اكتشاف جينات الاندماج. لذلك يمكننا استخدام بيانات RNA-seq هذه في أرشيف قراءة التسلسل (SRA) على NCBI للبحث عن جينات الاندماج في إنوم السرطان البشري. Y. Wang et al. (2015) علم الأمراض التشخيصي ، 10131.

فيوجنجدب (UTH ، الولايات المتحدة)
FusionGDB هي قاعدة بيانات Fusion Gene ، التي تهدف إلى توفير مورد أو مرجع للتعليق التوضيحي الوظيفي لجينات الاندماج في السرطان لتحقيق أهداف علاجية أفضل. قمنا أولاً بجمع 48117 FGs عبر عموم السرطان من ثلاثة موارد جينية اندماجية تمثيلية: قاعدة البيانات المحسّنة للنصوص الوراثية وبيانات RNA-seq (ChiTaRS 3.1) ، وهو مورد تكاملي لدمج النسخ المرتبطة بالسرطان (TumorFusions) ، وجينوم السرطان اندماج أطلس (TCGA) بواسطة Gao et al. لهؤلاء

48K FGs ، أجرينا تعليقات توضيحية وظيفية بما في ذلك تقييم الجينات عبر جينات اندماج السرطان الشامل ، وتخصيص إطار القراءة المفتوح (ORF) ، والبحث في مجال الاحتفاظ بالبروتين بناءً على بنية جينية متعددة الشكل مع نقاط فاصل متعددة ، وأخيراً قدمنا ​​نسخة الاندماج وتسلسل الأحماض الأمينية لكل نقطة كسر وأشكال إسوية للجينات. لكل جين شريك في الاندماج ، يمكن للمستخدم الوصول إلى العديد من التعليقات التوضيحية مثل ملخص الجينات ، ودرجات التقييم لكل جين في عموم السرطان ، وأنماط الجينات للعملية البيولوجية ، والوصف الوظيفي ، ومعلومات الاحتفاظ بـ 39 ميزة بروتينية وتفاعل البروتين البروتين (PPI) ، الأدوية والأمراض ذات الصلة من خلال ست فئات. من بين

فحص 44K FGs ORFs ، وكان هناك

11K إطار تحويل FGs. من بين هؤلاء ، حددنا 331 و 303 و 840 و 667 في الإطار FGs تحتفظ بمجال كيناز ومجال ربط الحمض النووي ومجالات الجين الورمي ومجالات العامل المشعر في بروتينات الاندماج. علاوة على ذلك ، حددنا 896 و 118 FGs داخل الإطار لم تحتفظ بمجالاتها الوظيفية لجينات مثبط الورم وجينات إصلاح تلف الحمض النووي ، على التوالي. من ناحية أخرى ، حددنا 6863 FGs تحتفظ بمجالاتها الوظيفية ، لكننا فقدنا الوظيفة بسبب تحول الإطار.

Fusion_Hub (في)
الاندماج الجيني هو حدث إعادة ترتيب للكروموسومات يلعب دورًا مهمًا في الإصابة بالسرطان بسبب إمكانات تكوين الأورام للبروتين الخيمري المتولد من خلال الاندماجات. نظرًا لتوفر عدد كبير من قواعد بيانات المجال العام التي توفر معلومات اندماج الجينات وعدم وجود أي محرك بحث للحصول بشكل جماعي على معلومات من قواعد البيانات هذه ، فقد قمنا بتطوير FusionHub ، وهو نظام أساسي موحد يبسط الشرح الواسع النطاق لجينات الاندماج. بالإضافة إلى ذلك ، لجعل FusionHub محورًا مركزيًا لجميع أنواع تحليل اندماج الجينات ، جنبًا إلى جنب مع وحدة التعليقات التوضيحية ، تم أيضًا دمج ميزتين أخريين هما التصور وتصميم siRNA.

شيمر دي بي (جامعة إيها النسائية ، كر)
يعتبر انتقال الكروموسوم واندماج الجينات من الأحداث المتكررة في الجينوم البشري وغالبًا ما يكونان سببًا للعديد من أنواع الورم. تم تصميم ChimerDB ليكون قاعدة معرفية لنصوص الدمج التي تم جمعها من مصادر عامة مختلفة مثل قاعدة بيانات Sanger CGP و OMIM و PubMed و Mitelman.

dbCRID (هيوستن ، الولايات المتحدة)
dbCRID هي قاعدة بيانات منسقة من السجلات التجارية البشرية والأمراض المرتبطة بها. يتضمن الإصدار الحالي من dbCRID 2643 إدخالات منسقة بشكل فردي من CRs المختبرة تجريبياً والأمراض المرتبطة بها و / أو الأعراض السريرية ، بالإضافة إلى معلومات مفصلة حول CRs ، بما في ذلك المواقع الدقيقة لنقاط التوقف والجينات المعنية وتسلسلات الوصلات ، التقنيات التجريبية المطبقة ، وروابط للدراسات الأصلية. تم جمع هذه البيانات من 1172 دراسة أصلية.

قاعدة بيانات ميتيلمان لانحرافات الكروموسومات في السرطان (NCBI ، Bethesda ، الولايات المتحدة)
المعلومات الموجودة في قاعدة بيانات ميتيلمان لانحرافات الكروموسومات في السرطان تتعلق بالانحرافات الصبغية بخصائص الورم ، بناءً على الحالات الفردية أو الارتباطات. تم استبعاد جميع البيانات يدويًا من الأدبيات التي كتبها فيليكس ميتيلمان ، وبيرتيل جوهانسون ، وفريدريك ميرتين
آرتشر - قاعدة بيانات Quiver Fusion (بولدر ، الولايات المتحدة)
Quiver هي قاعدة بيانات منسقة للاندماج الجيني المعروف المتورط في السرطان. تتضمن قاعدة البيانات البيانات المنسقة داخليًا والمدخلات المستوردة من المصادر المتاحة للجمهور. الإصدار الحالي: 4.5.1

arrayMap - المصفوفات الجينومية لتحديد عدد النسخ في سرطان الإنسان (UZH-SIB ، زيورخ ، الصين)
arrayMap هي قاعدة بيانات مرجعية منظمة وموارد معلوماتية حيوية تستهدف بيانات تحديد رقم النسخ في سرطان الإنسان. توفر قاعدة بيانات arrayMap نقطة دخول للتحليل التلوي وتكامل البيانات على مستوى الأنظمة لبيانات CNA الورمية الجينية عالية الدقة. بالنسبة لغالبية العينات ، فإن التصور على مستوى التحقيق بالإضافة إلى تمثيل البيانات المخصصة يسهلان مراجعة البيانات على مستوى الجينوم ومستوى الجينوم. يمكن ربط النتائج من التحديدات متعددة الحالات بتحليل البيانات النهائية وأدوات التصور ، كما نقدمها من خلال مشروع Progenetix الخاص بنا.
تم تطوير arrayMap بواسطة مجموعة "علم الوراثة الخلوية وعلم الجينوم الوراثي النظري" في معهد علوم الحياة الجزيئية بجامعة زيورخ.
الارتباط نحو arrayMap هو بناء حول تعريف ICD-O3 topo ومعايير ICD-O3 Morpho. إذا كانت العلامات غير مناسبة ، فمن الممكن دائمًا تحديد المصطلحات الأخرى.

  1. حدد كل المصطلحات التي تريدها في الواجهة
  2. إرسال
  3. التحديدات الخيارات والمعلمات
  4. حلل

dbSNP تعدد أشكال النوكليوتيدات الأحادية (NCBI ، Bethesda ، الولايات المتحدة)
قاعدة بيانات لتعدد أشكال النوكليوتيدات المفردة: أحد الجوانب الرئيسية للبحث في علم الوراثة هو ربط اختلافات التسلسل بالأنماط الظاهرية القابلة للتوريث. الاختلافات الأكثر شيوعًا هي تعدد أشكال النوكليوتيدات المفردة (SNPs) ، والتي تحدث مرة واحدة تقريبًا كل 100 إلى 300 قاعدة. نظرًا لأنه من المتوقع أن تسهل تعدد الأشكال على نطاق واسع الدراسات الجينية للارتباطات ، فقد كان هناك مؤخرًا اهتمام كبير باكتشاف واكتشاف تعدد الأشكال.

HAPMAP (NCBI ، Bethesda ، الولايات المتحدة)
مشروع HapMap الدولي عبارة عن شراكة بين علماء ووكالات تمويل من كندا والصين واليابان ونيجيريا والمملكة المتحدة والولايات المتحدة لتطوير مورد عام يساعد الباحثين في العثور على الجينات المرتبطة بالأمراض البشرية والاستجابة للمستحضرات الصيدلانية. راجع "حول مشروع HapMap الدولي" لمزيد من المعلومات.

1000 جينوم (EBI ، Hinxton ، المملكة المتحدة)
كتالوج عميق للتنوع الجيني البشري

خادم متغير Exome (EVS) (واشنطن ، الولايات المتحدة)
الهدف من مشروع تسلسل NHLBI GO Exome (ESP) هو اكتشاف جينات وآليات جديدة تساهم في اضطرابات القلب والرئة والدم من خلال الريادة في تطبيق تسلسل الجيل التالي لمناطق ترميز البروتين في الجينوم البشري عبر مجموعة متنوعة وغنية السكان ذوو النمط الظاهري ومشاركة مجموعات البيانات والنتائج هذه مع المجتمع العلمي لتوسيع وإثراء التشخيص والإدارة والعلاج لأمراض القلب والرئة والدم.

إكساك (واسع ، لنا)
اتحاد تجميع Exome (ExAC) هو تحالف من الباحثين الذين يسعون إلى تجميع ومواءمة بيانات تسلسل exome من مجموعة متنوعة من مشاريع التسلسل واسعة النطاق ، وإتاحة البيانات الموجزة للمجتمع العلمي الأوسع.
تشمل مجموعة البيانات المتوفرة على هذا الموقع 60706 أفرادًا غير مرتبطين متسلسلين كجزء من دراسات وراثية سكانية ومرضية مختلفة. لقد أزلنا الأفراد المصابين بأمراض الأطفال الشديدة ، لذا يجب أن تكون مجموعة البيانات هذه بمثابة مجموعة مرجعية مفيدة لترددات الأليل لدراسات الأمراض الشديدة. تمت إعادة معالجة جميع البيانات الأولية من هذه المشاريع من خلال نفس خط الأنابيب ، وتم استدعاء المتغير المشترك لزيادة الاتساق عبر المشاريع.

متصفح gnomAD (معهد برود ، بوسطن ، الولايات المتحدة)
قاعدة بيانات تجميع الجينوم (gnomAD) هي مورد تم تطويره بواسطة تحالف دولي من المحققين ، بهدف تجميع ومواءمة بيانات تسلسل الإكسوم والجينوم من مجموعة واسعة من مشاريع التسلسل واسعة النطاق ، وإتاحة البيانات الموجزة على نطاق أوسع. المجتمع العلمي. تمتد مجموعة البيانات المتوفرة على هذا الموقع على 123136 تسلسلًا من الإكسوم و 15496 تسلسلًا كاملًا للجينوم من أفراد غير مرتبطين متسلسلين كجزء من الدراسات الجينية المختلفة الخاصة بالأمراض والسكان. المحققون الرئيسيون في gnomAD والمجموعات التي ساهمت بالبيانات في الإصدار الحالي مدرجة هنا.

فارسوم (نحن)
VarSome هو محرك بحث ومجمع وأداة لتحليل التأثير للتنوع الجيني البشري ومشروع مجتمعي يهدف إلى مشاركة الخبرات العالمية حول المتغيرات البشرية. يعرض ويعرض شرحًا توضيحيًا تفصيليًا للمتغير المطلوب ، بما في ذلك الرموز المتعددة ، وحالة الإمراض المتوقعة من مجموعة متنوعة من الأدوات ، والسياق الجيني ، بالإضافة إلى معلومات من أكثر من 35 قاعدة بيانات عامة. يسمح للمستخدمين بتحديد الإمراضية للمتغيرات وربط المتغيرات بأنماط ظاهرية وأمراض ومنشورات محددة. أخيرًا ، يوفر تقييمًا آليًا للإمراضية يتوافق مع إرشادات ACMG المقبولة على نطاق واسع. لذلك فهي توفر مصدر تحليل قوي بالإضافة إلى مستودع للمعرفة العالمية المتراكمة لمجتمع الجينوميات. من وجهة نظر فنية ، فإنه يسمح بواجهة نقطة واحدة (API) قابلة للبرمجة مريحة للوصول إلى جميع بياناته

ICGC (OICR ، أونتاريو ، كاليفورنيا)
هدف ICGC: للحصول على وصف شامل للتغيرات الجينومية والنسخية والجينية في 50 نوعًا مختلفًا من الأورام و / أو الأنواع الفرعية ذات الأهمية السريرية والمجتمعية في جميع أنحاء العالم.

بوابة رقم نسخ TCGA
(معهد برود ، بوسطن ، الولايات المتحدة)
تم تصميم هذه البوابة لتسهيل استخدام وفهم بيانات رقم النسخ عالية الدقة المجمعة من عينات السرطان في TCGA. تم إنشاء جميع البيانات الموجودة في هذه البوابة في مركز توصيف الجينوم التابع لمعهد Broad Institute TCGA. تم تصميم هذه البوابة على غرار Tumorscape والتي تحتوي على بيانات رقم النسخ من مشاريع غير تابعة لـ TCGA (Beroukhim et al. ، 2010).

التعداد (مركز سانجر ، هينكستون ، المملكة المتحدة)
يعد التعداد الجيني للسرطان جهدًا مستمرًا لفهرسة تلك الجينات التي تسبب طفرات في الإصابة بالسرطان. تم نشر التعداد والتحليل الأصلي في Nature Reviews Cancer ، كما تتوفر معلومات التحليل التكميلية المتعلقة بالورقة.
التعداد ليس ثابتًا بل يتم تحديثه بانتظام / حسب الحاجة. على وجه الخصوص ، نحن ممتنون لفيليكس ميتيلمان وزملائه في تقديم معلومات عن المزيد من الجينات المشاركة في عمليات الانتقال غير الشائعة في اللوكيميا والأورام اللمفاوية. حاليًا ، أكثر من 1٪ من جميع الجينات البشرية متورطة عن طريق طفرة في السرطان. من بين هؤلاء ، ما يقرب من 90 ٪ لديهم طفرات جسدية في السرطان ، و 20 ٪ تحمل طفرات جرثومية تؤهب للسرطان و 10 ٪ تظهر طفرات جسدية وجرثومية.

كوزميك (مركز سانجر ، هينكستون ، المملكة المتحدة)
تنشأ جميع السرطانات نتيجة لاكتساب سلسلة من التشوهات الثابتة في تسلسل الحمض النووي ، والطفرات ، والتي يمنح الكثير منها في النهاية ميزة نمو للخلايا التي حدثت فيها. هناك قدر هائل من المعلومات المتاحة في المؤلفات العلمية المنشورة حول هذه التغييرات. تم تصميم COSMIC لتخزين وعرض معلومات الطفرات الجسدية والتفاصيل ذات الصلة ويحتوي على معلومات تتعلق بالسرطانات البشرية.

الحب قاعدة بيانات Leiden Open Variation 3.0 (Leiden، Ne
LOVD لتقف على قاعدة بيانات التنوع المفتوحة (المصدر) ليدن. الغرض من LOVD: توفير أداة مرنة ومتاحة مجانًا للتجميع المرتكز على الجينات وعرض تنوعات الحمض النووي. يوسع LOVD 3.0 هذه الفكرة ليوفر أيضًا تخزين البيانات التي تركز على المريض وتخزين بيانات NGS ، حتى للمتغيرات خارج الجينات. LOVD مفتوح المصدر ، تم إصداره بموجب ترخيص GPL ، ويتم تحسينه بشكل نشط ، ولدينا حاليًا إصدارات كل شهر.

برنامج BioMuta v2.0 (جامعة جورج واشنطن ، واشنطن العاصمة ، الولايات المتحدة)
BioMuta v2.0 عبارة عن تباين أحادي النوكليوتيدات (SNV) وقاعدة بيانات مرتبطة بالأمراض حيث يتم تعيين الاختلافات إلى الجينوم / البروتين / الجين.

DoCM قاعدة بيانات DoCM للطفرات المنسقة (WUSTL ، الولايات المتحدة)
DoCM ، قاعدة بيانات الطفرات المنسقة ، هي قاعدة بيانات منظمة للغاية للطفرات المعروفة المسببة للأمراض والتي توفر قوائم متغيرات يمكن استكشافها بسهولة مع روابط مباشرة إلى اقتباسات المصدر لتسهيل التحقق منها.

سيفيك التفسيرات السريرية للمتغيرات في السرطان (WUSTL ، الولايات المتحدة)
تستند قاعدة بيانات CIViC إلى عناصر الأدلة التي تشير إلى المتغيرات الأصلية والمجموعات المتغيرة والجينات. يمكنك استكشاف كيانات CIViC المختلفة وسماتها باستخدام القائمة الموجودة على يسارك (أو أعلى ، إذا كنت تشاهد هذا على شاشة الهاتف المحمول).

في علم الجينوم التكاملي Onco (برشلون ، إيس)
قاعدة بيانات سائق السرطان الطفري

NCG شبكة جينات السرطان (لندن ، المملكة المتحدة)
يحتوي NCG على معلومات حول قابلية الازدواجية والتطور والبروتين البروتين والتفاعل الجيني microRNA والوظيفة والتعبير وأهمية 2372 جينة سرطانية من 273 منشورًا يدويًا.
جينات السرطان هي جينات لها دور محرك في ظهور السرطان البشري عند حدوث طفرات في تسلسلها.
518 من الجينات السرطانية المعروفة من التعداد الجيني للسرطان. تم توثيق تورطهم في السرطان في الأدبيات.
1053 من الجينات المرشحة للسرطان مشتقة من المعالجة اليدوية لـ 175 منشورًا تقابل 188 جينومًا كاملاً أو فحصًا كاملًا لإعادة تسلسل سرطان الإكسوم. يتم الاستدلال على مشاركتهم في السرطان بطرق إحصائية مختلفة.

السرطان مترجم (برشلونة ، وفاق)
تم تصميم مترجم جينوم السرطان (CGI) لدعم تحديد تعديلات الورم التي تؤدي إلى المرض واكتشاف تلك التي قد تكون قابلة للتنفيذ من الناحية العلاجية. تعتمد CGI على المعرفة الموجودة التي تم جمعها من عدة موارد وعلى الأساليب الحسابية التي توضح التعديلات في الورم وفقًا لمستويات مختلفة من الأدلة.

السرطان ثلاثي الأبعاد Cancer3D (سانفورد بورهام ، كاليفورنيا)
Cancer3D هي قاعدة بيانات توحد المعلومات عن الطفرات الجسدية الخاطئة من TCGA و CCLE ، مما يسمح للمستخدمين باستكشاف مشكلتين مختلفتين مرتبطتين بالسرطان في نفس الوقت: حساسية الدواء / تحديد العلامات الحيوية والتنبؤ بمحركات السرطان. قاعدة البيانات هي واجهة لاثنين من الخوارزميات الجديدة ، e-Driver و e-Drug ، التي تستخدم المعلومات حول البنية الداخلية للبروتين للتنبؤ بمحركات السرطان الجديدة أو المؤشرات الحيوية للأدوية على التوالي. علاوة على ذلك ، فإنه يحدد الطفرات الجسدية المغلوطة من أكثر من 18000 بروتين بشري إلى أكثر من 25000 بنية بروتينية من PDB.

HGMD قاعدة بيانات تحور الجينات البشرية (معهد علم الوراثة الطبية ، كارديف ، المملكة المتحدة)
تعد الطفرة الجينية البشرية عملية محددة للغاية ، ولهذه الخصوصية آثار مهمة على طبيعة وانتشار وبالتالي تشخيص المرض الوراثي. في الواقع ، فإن الاعتراف بأن تسلسلات معينة من الحمض النووي مفرطة التغير قد أسفر عن أدلة على آليات الطفرات الذاتية المتضمنة وقدم نظرة ثاقبة على تعقيدات عمليات تكرار الحمض النووي وإصلاحه (Cooper and Krawczak 1993). من الناحية العملية ، قد يكون الفهم الكامل للعملية الطفرية مهمًا في الطب التشخيصي الجزيئي من خلال المساهمة في تحسينات في تصميم وفعالية إجراءات واستراتيجيات البحث عن الطفرات في الاضطرابات الوراثية المختلفة.
تمثل قاعدة بيانات طفرة الجينات البشرية (HGMD) محاولة لجمع آفات الجينات المعروفة (المنشورة) المسؤولة عن الأمراض البشرية الوراثية. في حين تم إنشاء قاعدة البيانات هذه في الأصل لدراسة آليات الطفرات في الجينات البشرية (Cooper and Krawczak 1993) ، فقد اكتسبت الآن فائدة أوسع بكثير من حيث أنها تتضمن مصدرًا مرجعيًا محدثًا وشاملًا لطيف الجينات البشرية الموروثة . وبالتالي ، يوفر HGMD معلومات ذات أهمية تشخيصية عملية لـ (1) الباحثين وأخصائيي التشخيص في علم الوراثة الجزيئية البشرية ، (2) الأطباء المهتمين بحالة وراثية معينة في مريض أو عائلة معينة ، و (3) المستشارين الوراثيين.

ديسيبل (بيثيسدا ، NCBI ، الولايات المتحدة)
dbVar هي قاعدة بيانات NCBI للتنوع الهيكلي الجيني - فهي تحتوي على عمليات الإدراج والحذف والازدواج والانعكاسات والبدائل متعددة النوكليوتيدات وإدخالات العنصر المتحرك وعمليات النقل وإعادة ترتيب الكروموسومات المعقدة

ديسيبل (بيثيسدا ، NCBI ، الولايات المتحدة)
dbVar هي قاعدة بيانات NCBI للتنوع الهيكلي الجيني - فهي تحتوي على عمليات الإدراج والحذف والازدواج والانعكاسات والبدائل متعددة النوكليوتيدات وإدخالات العنصر المتحرك وعمليات النقل وإعادة ترتيب الكروموسومات المعقدة

المتغيرات الجينومية DGV (تورنتو ، كاليفورنيا)
الهدف من قاعدة بيانات المتغيرات الجينومية هو توفير ملخص شامل للتنوع الهيكلي في الجينوم البشري. نحدد التباين الهيكلي على أنه التعديلات الجينية التي تنطوي على أجزاء من الحمض النووي أكبر من & gt1kb. الآن نقوم أيضًا بتعليق InDels في نطاق 100bp-1kb. يمثل محتوى قاعدة البيانات فقط التباين الهيكلي المحدد في عينات التحكم السليمة.
توفر قاعدة بيانات المتغيرات الجينومية كتالوجًا مفيدًا لبيانات التحكم للدراسات التي تهدف إلى ربط التباين الجينومي ببيانات النمط الظاهري. يتم تحديث قاعدة البيانات باستمرار ببيانات جديدة من الدراسات البحثية التي استعرضها الأقران. نرحب دائمًا بالاقتراحات والتعليقات المتعلقة بقاعدة البيانات من مجتمع البحث.

ديسفير مركز سانجر ، هينكستون ، المملكة المتحدة)
DECIPHER (قاعدة بيانات المتغيرات الجينية والنمط الظاهري في البشر باستخدام موارد المجموعة) هي قاعدة بيانات تفاعلية على شبكة الإنترنت تضم مجموعة من الأدوات المصممة للمساعدة في تفسير المتغيرات الجينية.
يعزز DECIPHER التشخيص السريري عن طريق استرداد المعلومات من مجموعة متنوعة من موارد المعلوماتية الحيوية ذات الصلة بالمتغير الموجود في المريض. يتم عرض متغير المريض في سياق كل من الاختلاف الطبيعي والاختلاف الممرض المبلغ عنه في هذا المكان مما يسهل التفسير.

SNPs3D (UMD ، الولايات المتحدة)
SNPs3D هو موقع ويب يقوم بتعيين التأثيرات الوظيفية الجزيئية لـ SNPs غير المترادفة بناءً على تحليل الهيكل والتسلسل.

قاعدة بيانات الرابطة الجينية (المعاهد الوطنية للصحة ، بيثيسدا ، الولايات المتحدة)
قاعدة بيانات الرابطة الجينية هي أرشيف لدراسات الارتباط الجيني البشري للأمراض والاضطرابات المعقدة. الهدف من قاعدة البيانات هذه هو السماح للمستخدم بتحديد تعدد الأشكال ذي الصلة طبيًا بسرعة من الحجم الكبير لتعدد الأشكال وبيانات الطفرات ، في سياق التسميات الموحدة.

OMIM الوراثة المندلية في الإنسان على الإنترنت "(جون هوبكنز ، بالتيمور ، الولايات المتحدة)
OMIM عبارة عن كتالوج للجينات البشرية والاضطرابات الوراثية تم تأليفه وتحريره بواسطة الدكتور فيكتور إيه ماكوسيك وزملائه في جونز هوبكنز وأماكن أخرى ، وتم تطويره لشبكة الويب العالمية بواسطة المركز الوطني لمعلومات التكنولوجيا الحيوية NCBI. تحتوي قاعدة البيانات على معلومات نصية وصور ومعلومات مرجعية. كما يحتوي على روابط غزيرة لقاعدة بيانات Entrez الخاصة بـ NCBI لمقالات MEDLINE ومعلومات التسلسل.

MedGen (NCBI ، Bethesda ، الولايات المتحدة)
MedGen هي بوابة NCBI للمعلومات حول الاضطرابات البشرية والأنماط الظاهرية الأخرى التي لها مكون وراثي. تم تصميم MedGen لخدمة أخصائيي الرعاية الصحية ومجتمع علم الوراثة الطبية والأطراف المعنية الأخرى من خلال توفير وصول مركزي إلى أنواع متنوعة من المحتوى. على سبيل المثال ، نظرًا لأن MedGen يجمع عددًا كبيرًا من المصطلحات المستخدمة لاضطرابات معينة في مفهوم معين ، فإنه يوفر حجر رشيد لأصحاب المصلحة الذين قد يستخدمون أسماء مختلفة لنفس الاضطراب. يعد الحفاظ على مجموعة محددة بوضوح من المفاهيم والمصطلحات للأنماط الظاهرية أمرًا ضروريًا لدعم الجهود المبذولة لتوصيف التباين الجيني من خلال تأثيره على أنماط ظاهرية معينة. يتيح تخصيص المعرفات لهذه المفاهيم الوصول الحسابي إلى معلومات النمط الظاهري ، وهو مطلب أساسي لتحليل البيانات الجينومية على نطاق واسع.

dbGap (NCBI ، Bethesda ، الولايات المتحدة)
تم تطوير قاعدة بيانات الأنماط الجينية والأنماط الظاهرية (dbGaP) لأرشفة وتوزيع البيانات والنتائج من الدراسات التي بحثت في تفاعل النمط الجيني والنمط الظاهري في البشر.

كلينفار (NCBI ، Bethesda ، الولايات المتحدة)
تم تصميم ClinVar لتوفير أرشيف عام يمكن الوصول إليه مجانًا لتقارير العلاقات بين الاختلافات البشرية والأنماط الظاهرية ، مع الأدلة الداعمة. من خلال القيام بذلك ، يسهل ClinVar الوصول إلى العلاقات المؤكدة بين الاختلاف البشري والحالة الصحية المرصودة وتاريخ هذا التفسير والتواصل بشأنها. يجمع ClinVar تقارير عن المتغيرات الموجودة في عينات المرضى ، والتأكيدات التي تم إجراؤها بخصوص أهميتها السريرية ، ومعلومات حول مقدم الطلب ، وغيرها من البيانات الداعمة. يتم تعيين الأليلات الموصوفة في التقديمات لتسلسلات مرجعية ، ويتم الإبلاغ عنها وفقًا لمعيار HGVS. ثم تقدم ClinVar البيانات للمستخدمين التفاعليين وكذلك أولئك الذين يرغبون في استخدام ClinVar في تدفقات العمل اليومية والتطبيقات المحلية الأخرى. تعمل ClinVar بالتعاون مع المنظمات المهتمة لتلبية احتياجات مجتمع علم الوراثة الطبية بأكبر قدر ممكن من الكفاءة والفعالية. معلومات حول استخدام ClinVar.

GTR (سجل الاختبارات الجينية) (المعاهد الوطنية للصحة ، بيثيسدا ، الولايات المتحدة)
يوفر سجل الاختبارات الجينية (GTR) موقعًا مركزيًا للتقديم الطوعي لمعلومات الاختبار الجيني من قبل مقدمي الخدمة. يشمل النطاق الغرض من الاختبار ، والمنهجية ، والصلاحية ، والدليل على فوائد الاختبار ، والاتصالات المخبرية وبيانات الاعتماد. الهدف الأسمى لـ GTR هو النهوض بالصحة العامة والبحث في الأساس الجيني للصحة والمرض.

الأهداف المفتوحة (هينكستون ، المملكة المتحدة)
تهدف منصة التحقق من الهدف (www.targetvalidation.org) إلى دعم الباحثين في تحديد أهداف الأدوية المبكرة بشكل أسرع وبثقة أكبر. تدمج المنصة البيانات من عدة قواعد بيانات عامة وهي نتيجة تعاون بين معهد سانجر وشركة جلاكسو سميث كلاين (GSK) والمعهد الأوروبي للمعلومات الحيوية (EBI) وشركة Biogen.
كجزء من جهودنا المستمرة لتحسين هذا المورد العام القيّم ، نريد التحدث إلى باحثي الأحياء التجريبية الذين يدرسون ارتباط الجينات البشرية بالأمراض. نحن مهتمون بفهم مدى تلبية المنصة لاحتياجاتك وما هي المعلومات والميزات الأخرى التي ستجعلها أكثر إفادة لك. تستغرق الجلسة النموذجية حوالي ساعة من وقتك. وجدها المشاركون السابقون أنها ممتعة للغاية!

هيوج نافيجيتور
يوفر HuGE Navigator الوصول إلى قاعدة معرفية محدثة باستمرار في علم وبائيات الجينوم البشري ، بما في ذلك معلومات عن انتشار المتغيرات الجينية وجمعيات الأمراض الجينية والتفاعلات الجينية والجينية مع البيئة ، وتقييم الاختبارات الجينية
مكتب علم جينوم الصحة العامة (OPHG) ، مركز السيطرة على الأمراض (CDC) أنشأت مراكز السيطرة على الأمراض والوقاية منها (CDC) مكتب جينوم الصحة العامة (OPHG) في عام 1997. تهدف OPHG إلى دمج علم الجينوم في أبحاث وسياسات وبرامج الصحة العامة ، والتي يمكن أن تحسن التدخلات المصممة للوقاية من الأمراض المزمنة والمعدية والبيئية والمهنية الرائدة في البلاد ومكافحتها.
تركز جهود OPHG على إجراء البحوث الجينومية المستندة إلى السكان ، وتقييم دور تاريخ صحة الأسرة في مخاطر الأمراض والوقاية منها ، ودعم عملية منهجية لتقييم الاختبارات الجينية ، وترجمة الجينوميات إلى أبحاث وبرامج الصحة العامة ، وتعزيز القدرة على جينوم الصحة العامة في برامج الوقاية من الأمراض. (مراكز السيطرة على الأمراض والوقاية منها (CDC)

ORPHANET: قاعدة بيانات للأمراض النادرة والأدوية اليتيمة (INSERM ، باريس ، فرنسا)
هذا المشروع هو نتيجة لحقيقة شائعة: من الصعب التعامل مع الأمراض النادرة للممارسين الطبيين. ويرجع ذلك إلى معرفتهم المحدودة بالتاريخ الطبيعي للأمراض ، ورعاية المريض المطلوبة ، والعلاج ، وأحيانًا حتى وجودها. المعرفة العلمية موجودة ، أو على الأقل معرفة جزئية ، لكنها مبعثرة. بسبب الوسائط المادية التي يتم توصيلها من خلالها ، يصعب الوصول إلى المعلومات بالنسبة للغالبية العظمى من الأطباء ، ناهيك عن المرضى وعائلاتهم. لا يتخصص سوى عدد قليل جدًا من الأطباء في هذه الأمراض ، ونادرًا ما تكون ممارساتهم معروفة ، وأحيانًا تكون غير معروفة تمامًا للممارسين الآخرين.
المجالات التي يتم تناولها حاليًا هي:

  • الأمراض النادرة ، أي تلك الأمراض التي يقل انتشارها عن 1/1000 في السكان
  • المشاريع البحثية المتعلقة بهذه الأمراض
  • الممارسات المتخصصة المتعلقة بهذه الأمراض
  • مختبرات متخصصة في تشخيصها
  • مختبرات البحث العاملة حاليا في هذا المجال
  • منظمات المرضى التي تتعامل مع هذه الأمراض
  • خوادم وطنية أو دولية أخرى مخصصة لهذه الأمراض.
  • قواعد بيانات وطنية أو دولية أخرى مماثلة أو مكملة
  • المراجع الببليوغرافية لهذه الأمراض
  • خدمة لتلقي الرسائل ترسل أسئلة المستخدم إلى خبير في هذا المجال.

DisGeNET (Es)
DisGeNET عبارة عن منصة اكتشاف تحتوي على واحدة من أكبر المجموعات المتاحة للجمهور من الجينات والمتغيرات المرتبطة بالأمراض البشرية (Pi ero et al.، 2016 Pi ero et al.، 2015). تقوم DisGeNET بدمج البيانات من المستودعات المنسقة من الخبراء وكتالوجات GWAS والنماذج الحيوانية والأدبيات العلمية. يتم شرح بيانات DisGeNET بشكل متجانس باستخدام المفردات الخاضعة للرقابة والأنطولوجيا التي يحركها المجتمع. بالإضافة إلى ذلك ، يتم توفير العديد من المقاييس الأصلية للمساعدة في تحديد أولويات علاقات النمط الوراثي.

ClinGen: مورد الجينوم السريري (المعاهد الوطنية للصحة ، بيثيسدا ، الولايات المتحدة)
ClinGen هو مورد ممول من المعاهد الوطنية للصحة (NIH) مخصص لبناء مورد مركزي موثوق يحدد الأهمية السريرية للجينات والمتغيرات لاستخدامها في الطب الدقيق والبحوث.

BioCentury BCIQ (ريدوود سيتي ، الولايات المتحدة)
لا تشبه BCIQ من BioCentury أي أداة بحث واستخبارات أعمال أخرى في السوق. فهو يجمع بين أكثر من 20 عامًا من التحليل الرائد لشركة BioCentury لصناعة الأدوية الحيوية مع أربع وحدات متكاملة سهلة الاستخدام ومتكاملة تمامًا. يتم فحص البيانات بشكل كامل وصيانتها بدقة. بكل بساطة ، BCIQ هي الأداة الأكثر دقة وعمقًا لاحتياجاتك البحثية وذكاء الأعمال

DgiDB قاعدة بيانات تفاعل الجينات الدوائية (WUSTL ، نحن)
تبحث تفاعلات البحث عن التفاعلات الجينية الدوائية حسب أسماء الجينات أو الأدوية

جينوم السرطان الخاص بي (فاندربيلت ، الولايات المتحدة)
يحتوي My Cancer Genome على معلومات حول التأثير السريري للعلامات الحيوية الجزيئية في الجينات والبروتينات وأنواع العلامات الحيوية الأخرى المرتبطة بالسرطان على استخدام العلاجات المضادة للسرطان في السرطان. هذه المعلومات مستمدة من ملصقات FDA و NCCN وإرشادات المجتمع المهني الأخرى والتجارب السريرية والمنشورات التي راجعها الأقران والمزيد.

CTD: قاعدة بيانات الجينوم المقارنة (جامعة ولاية نورث كارولاينا ، الولايات المتحدة)
توضح قاعدة بيانات علم الوراثة السمية المقارنة (CTD) الآليات الجزيئية التي تؤثر بها المواد الكيميائية البيئية على الأمراض التي تصيب الإنسان.
يتم تنسيق تفاعلات الجينات / البروتينات الكيميائية والعلاقات بين الأمراض الكيميائية والجينية من الأدبيات المنشورة ، ويتم دمجها مع البيانات المتنوعة (المواد الكيميائية ، والجينات / البروتينات ، والأمراض البشرية ، والمراجع ، والتسلسلات ، والكائنات الفقارية واللافقارية ، وعلم الوجود الجيني) لتسهيل أبحاث الصحة البيئية.

علم الجينات الصيدلية. المعرفه (ستانفورد ، الولايات المتحدة)
يعد PharmGKB موردًا شاملاً ينظم المعرفة حول تأثير التباين الجيني على استجابة الأدوية للباحثين والأطباء. نحن نشمل المعلومات السريرية بما في ذلك إرشادات الجرعات وعلامات الأدوية ، والجمعيات الجينية للأدوية التي يحتمل أن تكون قابلة للتنفيذ سريريًا والعلاقات بين النمط الجيني والنمط الظاهري.

جينوميات الحساسية للأدوية في السرطان (Welcome Trust) (سانجر ، هينكستون ، المملكة المتحدة)
مشروع جينوميات حساسية الأدوية في السرطان هو برنامج بحث أكاديمي لتحديد السمات الجزيئية للسرطانات التي تتنبأ بالاستجابة للأدوية المضادة للسرطان.

تجربة سريرية (المعاهد الوطنية للصحة ، بيثيسدا ، الولايات المتحدة)
ClinicalTrials.gov عبارة عن سجل وقاعدة بيانات لنتائج التجارب السريرية المدعومة فيدراليًا والخاص والتي أجريت في الولايات المتحدة وحول العالم. يمنحك ClinicalTrials.gov معلومات حول الغرض من التجربة ، ومن قد يشارك ، والمواقع ، وأرقام الهواتف لمزيد من التفاصيل. يجب استخدام هذه المعلومات جنبًا إلى جنب مع المشورة من المتخصصين في الرعاية الصحية.

DEPO (قاعدة بيانات الأدلة لعلم الأورام الدقيق) (جامعة واشنطن ، الولايات المتحدة)
DEPO هي قاعدة بيانات الأدلة الخاصة بعلاج الأورام الدقيق ، وتحتوي على معلومات متنوعة عن الأدوية مثل العلاج الدوائي ، ومستويات الأدلة (المعتمدة من إدارة الغذاء والدواء ، والتجارب السريرية ، وتقارير الحالة ، وما قبل السريرية) ، وأنواع السرطان للعلاجات المقصودة. يلخص المخطط الدائري أدناه المتغيرات المنسقة (حساسة للأدوية أو مقاومة) وفقًا لما يلي: تباين رقم النسخ (CNV) ، والذي يتوافق إما مع تضخيم رقم النسخ أو فقدان التعبير الجيني الانصهار ، والذي يشير إلى الجينات التي ترتفع وتنخفض يرتبط التعبير باستجابة الأدوية والطفرات ، والتي تشير إلى الخطأ ، والهراء ، و indels داخل الإطار ، وطفرات تغيير الإطارات

فاروس برنامج جينوم المخدرات (IDG) (المعاهد الوطنية للصحة ، الولايات المتحدة)
فاروس هو واجهة المستخدم لمركز إدارة المعرفة (KMC) لبرنامج إضاءة جينوم المخدرات (IDG) الممول من الصندوق المشترك للمعاهد الوطنية للصحة (NIH). (رقم المنحة 1U24CA224370-01). الهدف من KMC هو تطوير قاعدة معرفية شاملة ومتكاملة لجينوم المخدرات (DG) لإلقاء الضوء على الجزء غير المميز و / أو الموضح بشكل سيئ من DG ، مع التركيز على ثلاثة من أكثر عائلات البروتين المستهدفة للأدوية:

موارد علم الوراثة الخلوية الجزيئية (باري)
مجموعة من مجسات PAC و BAC مفيدة لأورام معينة.
بالتعاون مع مركز فحص YAC (ميلانو) ، وقسم أمراض الدم ، جامعة باري. نرحب بالتعاون للتحقق من صحة التحقيقات. تم التعرف على معظم الحيوانات المستنسخة عن طريق فحص مكتبات PAC أو BAC باستخدام بادئات مناسبة.

كوريمين (أوسلو ، لا)
Coremine Medical هو منتج من شركة PubGene مصمم للاستخدام من قبل أي شخص يسعى للحصول على معلومات حول الصحة والطب والبيولوجيا. إنه مثالي لأولئك الذين يبحثون عن نظرة عامة على موضوع معقد مع السماح بإمكانية "التعمق" في تفاصيل محددة. يتم تقديم نتائج البحث في شكل لوحة معلومات مكونة من لوحات تحتوي على فئات مختلفة من المعلومات تتراوح من المصادر التمهيدية إلى أحدث المقالات العلمية.

EVEX (تعدين النص) (توركو ، إيست)
EVEX هو مصدر لتعدين النصوص مبني على قمة ملخصات PubMed والنصوص الكاملة لـ PubMed Central. يحتوي على أكثر من 40 مليون حدث حيوي جزيئي من بين أكثر من 76 مليون ذكر اسم الجين / البروتين المستخرج تلقائيًا. تم إثراء بيانات التنقيب عن النص بشكل أكبر بنتائج تطبيع الجينات ، مما يسمح بالتكامل المباشر مع الموارد الخارجية. علاوة على ذلك ، توفر عائلات الجينات من Ensembl و HomoloGene تعميمات أحداث قائمة على التماثل. يقدم EVEX ارتباطات مباشرة وغير مباشرة بين الجينات والبروتينات ، مما يتيح التصفح الاستكشافي للأدبيات ذات الصلة.
يوفر موقع EVEX معلومات ملخصة عن مختلف الأحداث الجزيئية الحيوية ، مع مراعاة التباين المعجمي لرموز الجينات / البروتين والتعامل مع المرادفات والاختصارات. يمكن استرجاع كل من الارتباطات المباشرة وغير المباشرة ، وتوفر التعميمات القائمة على التنادد الفرصة لاسترداد المعلومات عن عائلات الجينات بأكملها.

iHOP (معلومات مرتبطة ارتباطًا تشعبيًا بالبروتينات (MSKCC ، نيويورك ، الولايات المتحدة)
تمتد شبكة من الجينات والبروتينات من خلال المؤلفات العلمية ، وتتطرق إلى الأنماط الظاهرية والأمراض ومتعة الجينات. أبلغنا عن تطوير نظام معلومات يوفر لهذه الشبكة كطريقة طبيعية للوصول إلى أكثر من عشرة ملايين ملخص في PubMed. من خلال استخدام الجينات والبروتينات كروابط تشعبية بين الجمل والملخصات ، نقوم بتحويل المعلومات الموجودة في PubMed إلى مصدر واحد قابل للملاحة ونجلب جميع مزايا الإنترنت إلى إعادة البحث في القراءة والكتابة العلمية.
علاوة على ذلك ، يمكن تركيب شبكة الأدب هذه على بيانات التفاعل التجريبية (على سبيل المثال ، بيانات الخميرة ثنائية الهجين من Dro sophila melanogaster و Caenorhabditis elegans) لإتاحة تحليل متزامن للمعرفة الجديدة والحالية. تحتوي الشبكة الإلكترونية ، المسماة بالارتباط التشعبي للمعلومات عبر البروتينات (iHOP) ، على نصف مليون جملة و 30.000 جين مختلف من البشر ، الفئران ، D. melanogaster ، C. elegans ، و zebrafish ، و Arabidopsis thaliana ، والخميرة ، و Escherichia coli. خادم iHOP متاح للجمهور هنا.

الأبراج الفلكية (إيفانستون ، الولايات المتحدة)
Zodiac ، مثل Google ، هو محرك بحث. تكتب استعلامات في شريط البحث أعلاه ، ويعرض Zodiac لاحقًا نتائج البحث. ننصحك بقراءة البرنامج التعليمي أعلاه ، أو متابعة القراءة أدناه.
يساعدك Zodiac على فهم كيفية تفاعل الجينات في حالات السرطان. تستند الشبكات الموجودة في Zodiac إلى استدلال إحصائي صارم باستخدام المعرفة السابقة وبيانات TCGA.
يساعد Zodiac في اكتشاف الجينات المتفاعلة ، وبالتالي ، الأهداف المحتملة للأدوية.
يحدد زودياك الانحرافات الجينية المحتملة مثل اندماج الجينات.
Zodiac سهل الاستخدام ويسمح بالبحث في الوقت الفعلي عن التفاعلات الجينية أثناء قراءة ورقة أو الاستماع إلى ندوة أو تصفح الإنترنت.

مؤشر داتا ميد ( نحن)
يتم تطوير النموذج الأولي DataMed (v3.0) لمؤشر اكتشاف البيانات BD2K NIH (DDI) من قبل فريق مشروع bioCADDIE. بمجرد اكتمال DataMed ، سيكون مفيدًا للمجتمع العلمي للسماح للمستخدمين بالبحث عن البيانات والعثور عليها عبر مستودعات مختلفة في مساحة واحدة. نحن نطلب ملاحظاتك لمساعدتنا في تشكيل التطوير المستقبلي لـ DataMeds. يرجى قضاء بعض الوقت للإجابة على نموذج الاستبيان الموجز هذا وإعطائنا أفكارك. نعتقد أن صوتك سيكون إضافة مهمة لتطوير نموذج bioCADDIE الأولي. شكرًا لك من فريق bioCADDIE.


شاهد الفيديو: من الجين إلى البروتين. تركيب DNA (شهر نوفمبر 2021).