معلومة

التباين الجيني في البشر والكائنات الحية النموذجية (مقاسة بواسطة SNPs)


كنت أتساءل ما هو نطاق كثافة SNP عبر الأنواع والكائنات الحية النموذجية.

على سبيل المثال ، ما هو تقدير معقول لكثافة SNP (أي x SNPs لكل 1 كيلو بايت) في:

  1. البشر
  2. البشر مع أعلى اختلاف (أي الأفارقة)
  3. يطير
  4. الفأر
  5. فئران المختبر ذات التباين الأعلى (على سبيل المثال ، فأر المختبر متساوي المنشأ 1 مع فأر المختبر متساوي المنشأ 2 مع أعلى تباين)
  6. كائن نموذجي بأعلى كثافة snp (يمكن أن يكون معملًا أو يحدث بشكل طبيعي)

كثافة SNP

الإنسان = ~ 1.18 SNPs لكل كيلو قاعدة

استنادًا إلى CgsSNP ، كان متوسط ​​أعداد SNPs لكل 10 كيلو بايت 8.33 و 8.44 و 8.09 في الجينوم البشري ، في المناطق الجينية ، وفي المناطق الجينية ، على التوالي.

مصدر: دراسة كثافة تعدد أشكال النوكليوتيدات المفردة (SNP) في الجينوم البشري وآثارها على التطور الجزيئي. بواسطة Zhao Z و Fu YX و Hewett-Emmett D و Boerwinkle E.

ذبابة الفاكهة سوداء البطن = ~ 0.02 SNP لكل كيلو قاعدة

يوفر FLYSNPdb بيانات تعدد أشكال النوكليوتيدات المفردة عالية الدقة (SNP) الخاصة بـ Drosophila melanogaster. تحتوي قاعدة البيانات حاليًا على 27367 تعدد الأشكال ، بما في ذلك> 3700 indels (إدراج / حذف) ، تغطي جميع الكرومومات الرئيسية. يتم تجميع هذه النيوكلوتايد في 2238 علامة ، والتي يتم توزيعها بالتساوي بمتوسط ​​كثافة علامة واحدة كل 50.3 كيلو بايت أو 6.6 جينات.

المصدر: FLYSNPdb: قاعدة بيانات SNP عالية الكثافة لـ Drosophila melanogaster

الفأر(موس العضلات) = 0.2 SNP لكل كيلو قاعدة

المصدر: تحليل تعدد الأشكال أحادي النوكليوتيدات على نطاق الجينوم يحدد أنماط النمط الفرداني في الماوس


التنوع الجيني في البشر والرئيسيات غير البشرية وعواقبه التطورية

يعد التنوع الجيني معلمة رئيسية في علم الوراثة السكانية وهو مهم لفهم عملية التطور ولتطوير استراتيجيات الحفظ المناسبة. مكنت التطورات الحديثة في تكنولوجيا التسلسل من قياس التنوع الجيني للكائنات المختلفة على مستوى النيوكليوتيدات وعلى نطاق الجينوم ، مما أسفر عن تقديرات أكثر دقة مما كان يمكن تحقيقه في السابق. في هذه المراجعة ، قمت بتجميع وتلخيص تقديرات التنوع الجيني في البشر والرئيسيات غير البشرية بناءً على دراسات حديثة على مستوى الجينوم. على الرغم من أن الدراسات التي أجريت على علم الوراثة السكانية أظهرت تقلبات في أحجام السكان بمرور الوقت ، فقد ظهرت أنماط عامة. كما هو موضح سابقًا ، يعد التنوع الجيني لدى البشر من أدنى المستويات بين الرئيسيات ، ومع ذلك ، فإن بعض أنواع الرئيسيات الأخرى تظهر تنوعًا جينيًا يمكن مقارنته أو حتى أقل منه في البشر. يوجد تباين أكبر من 10 أضعاف في التنوع الجيني بين أنواع الرئيسيات ، ووجدت ارتباطًا ضعيفًا بخصوبة الأنواع ولكن ليس مع حجم الجسم أو التكاثر. أناقش كذلك العواقب التطورية المحتملة لانخفاض حجم السكان على تطور أنواع الرئيسيات. يرتبط مستوى التنوع الجيني سلبًا مع نسبة غير المرادفة إلى تعدد الأشكال المترادف في مجموعة سكانية ، مما يشير إلى أن أعدادًا أكبر نسبيًا من الطفرات الضارة قليلاً تفصل في مجموعات صغيرة بدلاً من مجموعات كبيرة. على الرغم من أن انخفاض حجم السكان من المرجح أن يعزز تثبيت الطفرات الضارة قليلاً ، إلا أن هناك آليات جزيئية ، مثل الطفرات التعويضية على مستويات جزيئية مختلفة ، والتي قد تمنع تدهور اللياقة على مستوى السكان. تمت أيضًا مناقشة آثار الطفرات الضارة قليلاً من الدراسات النظرية والتجريبية وعلاقتها ببيولوجيا الحفظ في هذه المراجعة.


محتويات

تشمل أسباب الاختلافات بين الأفراد التشكيلة المستقلة ، وتبادل الجينات (العبور وإعادة التركيب) أثناء التكاثر (من خلال الانقسام الاختزالي) والأحداث الطفرية المختلفة.

هناك ثلاثة أسباب على الأقل لوجود الاختلاف الجيني بين السكان. قد يمنح الانتقاء الطبيعي ميزة تكيفية للأفراد في بيئة معينة إذا كان الأليل يوفر ميزة تنافسية. من المحتمل أن تحدث الأليلات قيد الانتقاء فقط في تلك المناطق الجغرافية التي تمنح فيها ميزة. العملية الثانية المهمة هي الانجراف الجيني ، وهو تأثير التغيرات العشوائية في مجموعة الجينات ، في ظل الظروف التي تكون فيها معظم الطفرات محايدة (أي أنه لا يبدو أن لها أي تأثير انتقائي إيجابي أو سلبي على الكائن الحي). أخيرًا ، لدى مجموعات المهاجرين الصغيرة اختلافات إحصائية - يُطلق عليها تأثير المؤسس - من إجمالي السكان الذين نشأوا عندما يستقر هؤلاء المهاجرون في مناطق جديدة ، وعادةً ما يختلف السكان المنحدرون من سلالة عن السكان الأصليين: تسود جينات مختلفة وهي أقل تنوعًا وراثيًا.

في البشر ، السبب الرئيسي [ بحاجة لمصدر ] هو الانجراف الجيني. قد يكون لتأثيرات المؤسس التسلسلي وحجم السكان الصغير السابق (زيادة احتمالية الانجراف الجيني) تأثير مهم في الاختلافات المحايدة بين السكان. [ بحاجة لمصدر ] السبب الرئيسي الثاني للاختلاف الجيني يرجع إلى الدرجة العالية من الحياد لمعظم الطفرات. يبدو أن عددًا صغيرًا ، ولكن مهمًا من الجينات ، قد خضع لانتقاء طبيعي حديث ، وهذه الضغوط الانتقائية تكون في بعض الأحيان خاصة بمنطقة واحدة. [6] [7]

يحدث التباين الجيني بين البشر على عدة نطاقات ، من التغيرات الجسيمة في النمط النووي البشري إلى تغيرات النيوكليوتيدات المفردة. [8] تم الكشف عن شذوذ الكروموسومات في 1 من 160 ولادة بشرية حية. بصرف النظر عن اضطرابات الكروموسومات الجنسية ، تؤدي معظم حالات اختلال الصيغة الصبغية إلى وفاة الجنين النامي (الإجهاض) ، وأكثر الكروموسومات الصبغية الإضافية شيوعًا بين المواليد الأحياء هي 21 و 18 و 13. [9]

تنوع النوكليوتيدات هو متوسط ​​نسبة النيوكليوتيدات التي تختلف بين شخصين. اعتبارًا من عام 2004 ، قدر تنوع النوكليوتيدات البشرية بما يتراوح بين 0.1٪ [10] و 0.4٪ من أزواج القاعدة. [11] في عام 2015 ، وجد مشروع 1000 جينوم ، الذي تسلسل ألف فرد من 26 مجموعة بشرية ، أن "جينوم [فردي] نموذجي يختلف عن الجينوم البشري المرجعي في 4.1 مليون إلى 5.0 مليون موقع ... يؤثر على 20 مليون قاعدة من التسلسل "الرقم الأخير يتوافق مع 0.6٪ من العدد الإجمالي للأزواج الأساسية. [3] جميع هذه المواقع تقريبًا (& gt99.9٪) عبارة عن اختلافات صغيرة ، إما تعدد أشكال النوكليوتيدات المفردة أو عمليات الإدراج أو الحذف القصيرة (indels) في التسلسل الجيني ، ولكن الاختلافات الهيكلية تمثل عددًا أكبر من أزواج القواعد مقارنةً بالنيوكليوتيدات المتعددة الأشكال و indels. [3] [12]

اعتبارًا من [تحديث] عام 2017 ، أدرجت قاعدة بيانات تعدد أشكال النوكليوتيدات المفردة (dbSNP) ، التي تسرد تعدد الأشكال ومتغيرات أخرى ، 324 مليون متغير موجود في الجينوم البشري المتسلسل. [2]

تحرير أشكال النوكليوتيدات المفردة

تعدد أشكال النوكليوتيدات الفردي (SNP) هو اختلاف في نيوكليوتيد واحد بين أعضاء نوع واحد يحدث في 1 ٪ على الأقل من السكان. كان لدى الأفراد البالغ عددهم 2504 الذين تميزوا بمشروع 1000 جينوم 84.7 مليون تعدد الأشكال من بينهم. [3] SNPs هي النوع الأكثر شيوعًا من اختلاف التسلسل ، وقد قُدرت في عام 1998 لتمثل 90 ٪ من جميع متغيرات التسلسل. [13] متغيرات التسلسل الأخرى هي عمليات التبادل ذات القاعدة الواحدة والحذف والإدراج. [14] تحدث النيوكلوتايد في المتوسط ​​حوالي كل 100 إلى 300 قاعدة [15] وبالتالي فهي المصدر الرئيسي لعدم التجانس.

إن SNP الوظيفي ، أو غير المترادف ، هو العامل الذي يؤثر على بعض العوامل مثل التضفير الجيني أو الحمض النووي الريبي المرسال ، وبالتالي يتسبب في اختلاف النمط الظاهري بين أعضاء الأنواع. حوالي 3 ٪ إلى 5 ٪ من النيوكلوتايد البشري تعمل (انظر مشروع HapMap الدولي). لا تزال النيوكلوتايد المحايدة أو المترادفة مفيدة كواسمات جينية في دراسات الارتباط على مستوى الجينوم ، بسبب عددها الهائل والميراث المستقر عبر الأجيال. [13]

SNP الترميز هو الذي يحدث داخل الجين. هناك 105 تعدد أشكال SNPs مرجعية بشرية ينتج عنها رموز توقف مبكرة في 103 جينات. هذا يتوافق مع 0.5٪ من تعدد الأشكال في الترميز. تحدث بسبب الازدواجية القطعية في الجينوم. تؤدي هذه النيوكلوتايد إلى فقدان البروتين ، ومع ذلك فإن كل أليلات SNP هذه شائعة ولا يتم تنقيتها في الاختيار السلبي. [16]

تعديل التباين الهيكلي

الاختلاف الهيكلي هو الاختلاف في بنية كروموسوم الكائن الحي. الاختلافات الهيكلية ، مثل التباين في عدد النسخ والحذف ، والانعكاس ، والإدخال والازدواجية ، مسؤولة عن تنوع وراثي بشري أكبر بكثير من تنوع النوكليوتيدات الأحادية. تم الانتهاء من ذلك في عام 2007 من تحليل التسلسلات الكاملة ثنائية الصبغيات لجينوم اثنين من البشر: كريج فنتر وجيمس دى واتسون. هذا يضاف إلى التسلسلين الفرديين اللذين كانا عبارة عن اندماج متواليات من العديد من الأفراد ، تم نشرهما بواسطة مشروع الجينوم البشري و Celera Genomics على التوالي. [17]

وفقًا لـ 1000 Genomes Project ، يمتلك الإنسان النموذجي 2،100 إلى 2،500 اختلاف هيكلي ، والتي تشمل ما يقرب من 1،000 عملية حذف كبيرة ، و 160 متغيرًا لعدد النسخ ، و 915 إدخال Alu ، و 128 L1 ، و 51 إدخالًا من SVA ، و 4 NUMTs ، و 10 عمليات انقلاب. [3]

نسخ تباين الرقم تحرير

تباين رقم النسخ (CNV) هو اختلاف في الجينوم بسبب حذف أو تكرار مناطق كبيرة من الحمض النووي على بعض الكروموسوم. تشير التقديرات إلى أن 0.4٪ من جينومات البشر غير المرتبطين تختلف فيما يتعلق بعدد النسخ. عند تضمين التباين في عدد النسخ ، يُقدر التباين الجيني من إنسان لآخر بما لا يقل عن 0.5٪ (99.5٪ تشابه). [18] [19] [20] [21] توارث تباينات رقم النسخ ولكن يمكن أن تظهر أيضًا أثناء التطوير. [22] [23] [24] [25]

تم إنشاء خريطة بصرية بالمناطق ذات التباين الجيني العالي للتجميع المرجعي البشري الحديث نسبيًا إلى إنسان نياندرتال البالغ 50 كيلو [26] بواسطة براتاس وآخرون. [27]

تحرير علم التخلق

الاختلاف اللاجيني هو الاختلاف في العلامات الكيميائية التي ترتبط بالحمض النووي وتؤثر على كيفية قراءة الجينات. العلامات ، "تسمى العلامات اللاجينية ، تعمل كمفاتيح تتحكم في كيفية قراءة الجينات". [28] في بعض الأليلات ، يمكن وراثة الحالة اللاجينية للحمض النووي ، والنمط الظاهري المرتبط بها ، عبر أجيال من الأفراد. [29]

تحرير التباين الجيني

التباين الجيني هو مقياس لميل الأنماط الجينية الفردية في مجتمع ما إلى التباين (الاختلاف) عن بعضها البعض. يختلف التباين عن التنوع الجيني ، وهو مقدار التباين الملحوظ في مجموعة سكانية معينة. تنوع السمة هو مدى تميل هذه السمة إلى التباين استجابةً للتأثيرات البيئية والوراثية.

تحرير كلاينس

في علم الأحياء ، يعتبر cline سلسلة متصلة من الأنواع أو المجموعات السكانية أو الأصناف أو أشكال الكائنات الحية التي تظهر اختلافات نمطية و / أو وراثية تدريجية عبر منطقة جغرافية ، عادةً نتيجة عدم التجانس البيئي. [30] [31] [32] في الدراسة العلمية للتنوع الجيني البشري ، يمكن تعريف سلسلة الجينات بدقة وإخضاعها لمقاييس كمية.

هابلوغروبس تحرير

في دراسة التطور الجزيئي ، فإن مجموعة هابلوغروب هي مجموعة من الأنماط الفردانية المتشابهة التي تشترك في سلف مشترك مع طفرة واحدة في تعدد أشكال النوكليوتيدات (SNP). توفر دراسة مجموعات هابلوغروب معلومات حول أصول الأجداد التي يعود تاريخها إلى آلاف السنين. [33]

أكثر مجموعات الفرد البشرية التي تم دراستها شيوعًا هي مجموعات الكروموسوم Y (Y-DNA) ومجموعات الفردانية DNA للميتوكوندريا (mtDNA) ، وكلاهما يمكن استخدامه لتحديد المجموعات الجينية. يتم تمرير Y-DNA فقط على طول الخط الأبوي ، من الأب إلى الابن ، بينما يتم تمرير mtDNA عبر الخط الأمومي ، من الأم إلى كل من الابنة أو الابن. قد يتغير الحمض النووي Y-DNA و mtDNA عن طريق الطفرة المصادفة في كل جيل.

الرقم المتغير المترادف يكرر التحرير

عدد التكرار الترادفي المتغير (VNTR) هو تغير طول التكرار الترادفي. التكرار الترادفي هو التكرار المجاور لتسلسل نوكليوتيد قصير. توجد التكرارات الترادفية على العديد من الكروموسومات ، ويختلف طولها بين الأفراد. يعمل كل متغير كآليل موروث ، لذلك يتم استخدامه لتحديد الهوية الشخصية أو الأبوية. تحليلهم مفيد في أبحاث علم الوراثة وعلم الأحياء والطب الشرعي وبصمات الحمض النووي.

تسمى التكرارات الترادفية القصيرة (حوالي 5 أزواج أساسية) بالأقمار الصناعية الصغيرة ، بينما تسمى الأطول منها بالأقمار الصناعية الصغيرة.

أصل أفريقي حديث للإنسان الحديث

يفترض الأصل الأفريقي الحديث لنموذج الإنسان الحديث تشتت السكان غير الأفارقة من البشر المعاصرين تشريحياً بعد 70000 سنة مضت. حدث التشتت داخل إفريقيا بشكل ملحوظ في وقت سابق ، على الأقل منذ 130،000 سنة. نشأت نظرية "الخروج من إفريقيا" في القرن التاسع عشر ، كاقتراح مبدئي في كتاب تشارلز داروين نزول الرجل، [34] لكنها ظلت تخمينية حتى ثمانينيات القرن الماضي عندما تم دعمها من خلال دراسة الحمض النووي للميتوكوندريا الحالية ، جنبًا إلى جنب مع أدلة من الأنثروبولوجيا الفيزيائية للعينات القديمة.

وفقًا لدراسة أجريت عام 2000 لتغير تسلسل كروموسوم Y ، [35] ترجع كروموسومات Y البشرية أصلها إلى إفريقيا ، وغادر أحفاد السلالة المشتقة إفريقيا وتم استبدالهم في نهاية المطاف بالكروموسومات البشرية القديمة Y في أوراسيا. تُظهر الدراسة أيضًا أن أقلية من السكان المعاصرين في شرق إفريقيا وخويسان هم من نسل السلالات الأبوية الأكثر تشريحًا للإنسان الحديث تشريحًا والتي غادرت إفريقيا منذ 35000 إلى 89000 سنة. [35] من الأدلة الأخرى التي تدعم هذه النظرية أن الاختلافات في قياسات الجمجمة تتناقص مع المسافة من إفريقيا بنفس معدل الانخفاض في التنوع الجيني. يتناقص التنوع الجيني البشري في السكان الأصليين الذين لديهم مسافة مهاجرة من إفريقيا ، ويُعتقد أن هذا يرجع إلى الاختناقات أثناء الهجرة البشرية ، وهي أحداث تقلل مؤقتًا من حجم السكان. [36] [37]

حددت دراسة التجميع الجيني لعام 2009 ، والتي صنعت 1327 علامة متعددة الأشكال في مجموعات سكانية أفريقية مختلفة ، ستة مجموعات سلفية. التجمع يتوافق بشكل وثيق مع العرق والثقافة واللغة. [38] دراسة كاملة لتسلسل الجينوم أجريت عام 2018 لسكان العالم ، لاحظت وجود مجموعات متشابهة بين السكان في إفريقيا. في K = 9 ، حددت مكونات الأجداد المتميزة السكان الناطقين باللغة الأفروآسيوية الذين يسكنون شمال إفريقيا وشمال شرق إفريقيا السكان الناطقين بالنايلو الصحراوية في شمال شرق إفريقيا وشرق إفريقيا سكان آري في شمال شرق إفريقيا السكان الناطقين بالنيجر والكونغو في الغرب والوسط إفريقيا ، وغرب إفريقيا ، وشرق إفريقيا ، والجنوب الأفريقي ، مجموعات الأقزام في وسط إفريقيا ، وسكان الخويسان في جنوب إفريقيا. [39]

علم الوراثة السكانية تحرير

بسبب السلالة المشتركة لجميع البشر ، هناك عدد قليل فقط من المتغيرات التي لها اختلافات كبيرة في التردد بين السكان. ومع ذلك ، فإن بعض المتغيرات النادرة في سكان العالم أكثر تواترًا في مجموعة واحدة على الأقل من السكان (أكثر من 5٪). [40]

يُفترض عمومًا أن البشر الأوائل غادروا إفريقيا ، وبالتالي لا بد أن يكونوا قد مروا عبر عنق الزجاجة قبل الاختلاف الأفريقي-الأوراسي منذ حوالي 100000 عام (حوالي 3000 جيل). للتوسع السريع لعدد السكان الصغير سابقًا تأثيران مهمان على توزيع التنوع الجيني. أولا ، ما يسمى ب تأثير المؤسس يحدث عندما يجلب السكان المؤسسون مجموعة فرعية فقط من التباين الجيني من سكان أسلافهم. ثانيًا ، عندما يصبح المؤسسون أكثر فصلًا جغرافيًا ، فإن احتمال تزاوج شخصين من مجموعات مؤسسية مختلفة يصبح أقل. تأثير هذا التزاوج المتنوع هو تقليل تدفق الجينات بين المجموعات الجغرافية وزيادة المسافة الجينية بين المجموعات. [ بحاجة لمصدر ]

أثر توسع البشر من أفريقيا على توزيع التنوع الجيني بطريقتين أخريين. أولاً ، يعاني السكان الأصغر (المؤسسون) من انحراف جيني أكبر بسبب التقلبات المتزايدة في تعدد الأشكال المحايد. ثانيًا ، كانت الأشكال المتعددة الجديدة التي نشأت في مجموعة واحدة أقل احتمالًا للانتقال إلى مجموعات أخرى حيث تم تقييد تدفق الجينات. [ بحاجة لمصدر ]

يميل السكان في إفريقيا إلى أن يكون لديهم قدر أقل من عدم توازن الروابط مقارنة بالسكان خارج إفريقيا ، ويرجع ذلك جزئيًا إلى الحجم الأكبر للسكان في إفريقيا على مدار تاريخ البشرية وجزئيًا بسبب عدد البشر المعاصرين الذين غادروا إفريقيا لاستعمار بقية السكان. يبدو أن العالم كان منخفضًا نسبيًا. [41] على النقيض من ذلك ، فإن المجموعات السكانية التي خضعت لتخفيضات كبيرة في الحجم أو توسعات سريعة في الماضي والمجموعات التي تشكلت عن طريق مزيج من مجموعات أسلاف منفصلة سابقًا يمكن أن يكون لديها مستويات عالية بشكل غير عادي من عدم توازن الارتباط [41]

توزيع التباين تحرير

من المستحيل وصف توزيع المتغيرات الجينية داخل وبين التجمعات البشرية بإيجاز بسبب صعوبة تحديد "السكان" ، والطبيعة الشائكة للتنوع ، وعدم التجانس عبر الجينوم (Long and Kittles 2003). بشكل عام ، ومع ذلك ، يوجد ما متوسطه 85 ٪ من التباين الجيني داخل السكان المحليين ،

7 ٪ بين السكان المحليين داخل نفس القارة ، و

8٪ من الاختلاف يحدث بين المجموعات الكبيرة التي تعيش في قارات مختلفة. [42] [43] تتنبأ نظرية الأصل الأفريقي الحديثة للإنسان بوجود تنوع أكبر بكثير في إفريقيا من أي مكان آخر ، وأن التنوع يجب أن ينخفض ​​أكثر كلما تم أخذ عينات من السكان من إفريقيا.

تحرير التباين المظهري

تتمتع إفريقيا جنوب الصحراء بأكبر قدر من التنوع الجيني البشري ، وقد ثبت أن الشيء نفسه ينطبق على التباين الظاهري في شكل الجمجمة. [36] [44] يرتبط النمط الظاهري بالنمط الجيني من خلال التعبير الجيني. يتناقص التنوع الجيني بسلاسة مع مسافة الهجرة من تلك المنطقة ، والتي يعتقد العديد من العلماء أنها أصل الإنسان الحديث ، وينعكس هذا الانخفاض من خلال انخفاض تباين النمط الظاهري. قياسات الجمجمة هي مثال على سمة مادية يتناقص تباينها داخل السكان مع بعد المسافة من إفريقيا.

يشبه توزيع العديد من الصفات الجسدية توزيع الاختلاف الجيني داخل وبين السكان البشريين (American Association of Physical Anthropologists 1996 Keita and Kittles 1997). على سبيل المثال،

90٪ من التباين في أشكال الرأس البشري يحدث داخل المجموعات القارية ، و

10٪ يفصلون المجموعات ، مع تباين أكبر في شكل الرأس بين الأفراد من أسلاف أفريقيين حديثين (Relethford 2002).

استثناء بارز للتوزيع الشائع للخصائص الفيزيائية داخل المجموعات وفيما بينها هو لون البشرة. يحدث ما يقرب من 10٪ من التباين في لون الجلد ضمن مجموعات ، و

90٪ يحدث بين المجموعات (Relethford 2002). يشير هذا التوزيع للون الجلد ونمذجه الجغرافي - مع الأشخاص الذين عاش أسلافهم في الغالب بالقرب من خط الاستواء ولديهم بشرة داكنة أكثر من أولئك الذين عاشوا في الغالب في خطوط العرض العليا - إلى أن هذه السمة كانت تحت ضغط انتقائي قوي.يبدو أن البشرة الداكنة يتم اختيارها بشدة في المناطق الاستوائية لمنع حروق الشمس وسرطان الجلد والتحلل الضوئي لحمض الفوليك وتلف الغدد العرقية. [45]

يعد فهم كيفية تأثير التنوع الجيني في البشر على مستويات مختلفة من التعبير الجيني مجالًا نشطًا للبحث. بينما ركزت الدراسات السابقة على العلاقة بين تباين الحمض النووي وتعبير الحمض النووي الريبي ، فإن الجهود الأحدث توصيف التحكم الجيني للجوانب المختلفة للتعبير الجيني بما في ذلك حالات الكروماتين ، [46] والترجمة ، [47] ومستويات البروتين. [48] ​​وجدت دراسة نُشرت في عام 2007 أن 25٪ من الجينات أظهرت مستويات مختلفة من التعبير الجيني بين السكان من أصل أوروبي وآسيوي. [49] [50] [51] [52] [53] كان يُعتقد أن السبب الرئيسي لهذا الاختلاف في التعبير الجيني هو تعدد الأشكال في مناطق تنظيم الجينات في الحمض النووي. وجدت دراسة أخرى نُشرت في عام 2007 أن ما يقرب من 83٪ من الجينات تم التعبير عنها على مستويات مختلفة بين الأفراد وحوالي 17٪ بين السكان من أصل أوروبي وأفريقي. [54] [55]

مؤشر تثبيت رايت كمقياس للتباين تحرير

طور عالم الوراثة السكانية سيوال رايت مؤشر التثبيت (غالبًا ما يتم اختصاره إلى Fشارع) كطريقة لقياس الاختلافات الجينية بين السكان. غالبًا ما تُستخدم هذه الإحصائية في التصنيف لمقارنة الاختلافات بين أي مجموعتين من السكان عن طريق قياس الاختلافات الجينية بين السكان وبين الجينات الفردية ، أو للعديد من الجينات في وقت واحد. [56] غالبًا ما يُذكر أن مؤشر التثبيت للإنسان يبلغ حوالي 0.15. يُترجم هذا إلى ما يقدر بـ 85٪ من التباين المقاس في إجمالي عدد السكان داخل الأفراد من نفس السكان ، ويحدث حوالي 15٪ من التباين بين السكان. تشير هذه التقديرات إلى أن أي شخصين من مجموعات سكانية مختلفة من المحتمل أن يكونا أكثر تشابهًا مع بعضهما البعض أكثر من أي منهما لعضو في مجموعتهما. [57] [58] "لقد أدى التاريخ التطوري المشترك للبشر الأحياء إلى ارتباط كبير بين جميع الأشخاص الأحياء ، كما يتضح على سبيل المثال من خلال مؤشر التثبيت المنخفض جدًا (Fشارع) بين المجموعات البشرية الحية. "ريتشارد ليونتين ، الذي أكد هذه النسب ، لم يخلص بالتالي إلى أن" العرق "ولا" السلالات الفرعية "كانت طرقًا مناسبة أو مفيدة لوصف المجموعات البشرية. [42]

يعتقد رايت نفسه أن القيم & gt0.25 تمثل تنوعًا جينيًا كبيرًا جدًا وأن Fشارع من 0.15 إلى 0.25 يمثل تباينًا كبيرًا. ومع ذلك ، فإن حوالي 5٪ من الاختلاف البشري يحدث بين السكان داخل القارات Fشارع تم العثور على قيم بين المجموعات القارية من البشر (أو الأجناس) منخفضة تصل إلى 0.1 (أو ربما أقل) في بعض الدراسات ، مما يشير إلى مستويات أكثر اعتدالًا من التباين الجيني. [56] رد جريفز (1996) على ذلك Fشارع لا ينبغي أن تستخدم كمؤشر لحالة النوع الفرعي ، حيث يتم استخدام الإحصاء لقياس درجة التمايز بين المجموعات السكانية ، [56] على الرغم من انظر أيضًا Wright (1978). [59]

يقدم جيفري لونج وريك كيتلز نقدًا مطولًا لتطبيق Fشارع إلى السكان في ورقتهم الصادرة عام 2003 بعنوان "التنوع الجيني البشري وعدم وجود الأجناس البيولوجية". وجدوا أن الرقم 85٪ مضلل لأنه يشير إلى أن جميع السكان تحتوي في المتوسط ​​على 85٪ من كل التنوع الجيني. وهم يجادلون بأن النموذج الإحصائي الأساسي يفترض بشكل غير صحيح وجود تواريخ متساوية ومستقلة للتباين لكل مجموعة بشرية كبيرة. نهج أكثر واقعية هو فهم أن بعض المجموعات البشرية هي أبوية لمجموعات أخرى وأن هذه المجموعات تمثل مجموعات paraphyletic لمجموعات النسب الخاصة بهم. على سبيل المثال ، في ظل نظرية الأصل الأفريقي الحديثة ، فإن السكان البشريين في إفريقيا متشابهون بالنسبة لجميع المجموعات البشرية الأخرى لأنها تمثل مجموعة الأجداد التي ينحدر منها جميع السكان غير الأفارقة ، ولكن أكثر من ذلك ، فإن المجموعات غير الأفريقية تنبع فقط من مجموعة صغيرة. عينة غير تمثيلية من السكان الأفارقة. وهذا يعني أن جميع المجموعات غير الأفريقية ترتبط ببعضها البعض ارتباطًا وثيقًا ببعض المجموعات الأفريقية (ربما شرق إفريقيا) أكثر من ارتباطها بالمجموعات الأخرى ، علاوة على أن الهجرة من إفريقيا تمثل عنق الزجاجة الجيني ، مع الكثير من التنوع الذي كانت موجودة في أفريقيا ولم يتم تنفيذها من أفريقيا من قبل المجموعات المهاجرة. في ظل هذا السيناريو ، لا يتمتع السكان البشريون بكميات متساوية من التباين المحلي ، بل تقل كميات التنوع كلما ابتعدوا عن إفريقيا. وجدت Long and Kittles أنه بدلاً من 85 ٪ من التنوع الجيني البشري الموجود في جميع السكان ، يوجد حوالي 100 ٪ من التنوع البشري في مجموعة أفريقية واحدة ، في حين أن حوالي 70 ٪ فقط من التنوع الجيني البشري موجود في مجموعة مستمدة من غينيا الجديدة. جادل لونج وكيتلز بأن هذا لا يزال ينتج مجموعة بشرية عالمية متجانسة وراثيًا مقارنة بمجموعات الثدييات الأخرى. [60]

تحرير المزيج القديم

هناك فرضية مفادها أن الإنسان الحديث تشريحيا تزاوج مع إنسان نياندرتال خلال العصر الحجري القديم الأوسط. في مايو 2010 ، قدم مشروع جينوم إنسان نياندرتال دليلًا وراثيًا على أن التزاوج قد حدث بالفعل وأن جزءًا صغيرًا ولكن مهمًا ، حوالي 2-4 ٪ ، من خليط إنسان نياندرتال موجود في الحمض النووي لأوراسيا وأوقيانوسيا الحديثين ، ويكاد يكون غائبًا في المناطق الفرعية. - سكان الصحراء الأفريقية. [61] [62]

يُعتقد أن ما بين 4 ٪ و 6 ٪ من جينوم سكان ميلانيزيا (يمثلهم بابوا غينيا الجديدة وجزر بوغانفيل) مشتق من أشباه البشر دينيسوفا - وهو نوع غير معروف سابقًا يشترك في أصل مشترك مع إنسان نياندرتال. ربما تم تقديمه خلال الهجرة المبكرة لأسلاف الميلانيزيين إلى جنوب شرق آسيا. يشير تاريخ التفاعل هذا إلى أن إنسان دينيسوفان كان في يوم من الأيام تراوحًا على نطاق واسع في شرق آسيا. [63]

وهكذا ، يظهر الميلانيزيون على أنهم أكثر السكان اختلاطًا بالديون القديمة ، ولديهم مزيج من دينيسوفان / إنسان نياندرتال.

في دراسة نُشرت في عام 2013 ، درس جيفري وول من جامعة كاليفورنيا بيانات تسلسل الجينوم الكامل ووجد معدلات أعلى من الانغماس لدى الآسيويين مقارنة بالأوروبيين. [64] هامر وآخرون. اختبرت الفرضية القائلة بأن الجينوم الأفريقي المعاصر له بصمات تدفق الجينات مع أسلاف الإنسان القدماء ووجد دليلًا على وجود اختلاط قديم في جينومات بعض المجموعات الأفريقية ، مما يشير إلى أن كميات متواضعة من تدفق الجينات كانت منتشرة على نطاق واسع عبر الزمان والمكان أثناء تطور الإنسان الحديث تشريحيًا . [65]

أعادت البيانات الجديدة حول التباين الجيني البشري إشعال الجدل حول أساس بيولوجي محتمل لتصنيف البشر إلى أعراق. يحيط معظم الجدل بمسألة كيفية تفسير البيانات الجينية وما إذا كانت الاستنتاجات المستندة إليها صحيحة. يجادل بعض الباحثين بأن العرق الذي تم تحديده ذاتيًا يمكن استخدامه كمؤشر على الأصل الجغرافي لبعض المخاطر الصحية والأدوية.

على الرغم من أن الاختلافات الجينية بين المجموعات البشرية صغيرة نسبيًا ، إلا أن هذه الاختلافات في جينات معينة مثل دافي ، ABCC11 ، SLC24A5 ، التي تسمى علامات معلومات السلالة (AIMs) ، يمكن استخدامها لتحديد مواقع العديد من الأفراد بشكل موثوق ضمن مجموعات واسعة قائمة على أساس جغرافي. على سبيل المثال ، كشفت تحليلات الكمبيوتر لمئات من المواقع متعددة الأشكال التي تم أخذ عينات منها في مجموعات سكانية موزعة عالميًا عن وجود تجمعات جينية مرتبطة تقريبًا بالمجموعات التي احتلت تاريخياً مناطق قارية وشبه قارية كبيرة (روزنبرغ وآخرون. 2002 بمشاد وآخرون. 2003).

جادل بعض المعلقين بأن أنماط التباين هذه توفر مبررًا بيولوجيًا لاستخدام الفئات العرقية التقليدية. وهم يجادلون بأن التجمعات القارية تتوافق تقريبًا مع تقسيم البشر إلى أفارقة من جنوب الصحراء الكبرى ، وأوروبيون ، وغرب آسيويون ، ووسط آسيا ، وجنوب آسيويون ، وشمال أفريقيون ، وشرق آسيويون ، وجنوب شرق آسيويون ، وبولينيزيون ، وأمريكيون أصليون ، وسكان آخرون من أوقيانوسيا (الميلانيزيون ، الماكرونيزيون والسكان الأصليون الأستراليون) (Risch وآخرون. 2002). يختلف مراقبون آخرون ، قائلين إن نفس البيانات تقوض المفاهيم التقليدية للمجموعات العرقية (King and Motulsky 2002 Calafell 2003 Tishkoff and Kidd 2004 [11]). وهم يشيرون ، على سبيل المثال ، إلى أن المجموعات السكانية الرئيسية التي تعتبر أعراقًا أو مجموعات فرعية داخل الأعراق لا تشكل بالضرورة مجموعاتها الخاصة.

علاوة على ذلك ، نظرًا لأن التباين الجيني البشري هو طين ، فإن العديد من الأفراد ينتمون إلى مجموعتين أو أكثر من المجموعات القارية. وبالتالي ، فإن "السلالة البيوجغرافية" الجينية القائمة على أساس وراثي والمخصصة لأي شخص معين بشكل عام سيتم توزيعها على نطاق واسع وستكون مصحوبة بشكوك كبيرة (Pfaff وآخرون. 2004).

في أجزاء كثيرة من العالم ، اختلطت المجموعات بطريقة تجعل العديد من الأفراد لديهم أسلاف حديثة نسبيًا من مناطق متفرقة على نطاق واسع. على الرغم من أن التحليلات الجينية لأعداد كبيرة من المواقع يمكن أن تنتج تقديرات للنسبة المئوية لأسلاف الشخص القادمين من مجموعات قارية مختلفة (شرايفر وآخرون. 2003 بمشاد وآخرون. 2004) ، قد تفترض هذه التقديرات تمييزًا خاطئًا للسكان الأبوين ، حيث تبادلت المجموعات البشرية زملائها من النطاقات المحلية إلى النطاق القاري عبر التاريخ (Cavalli-Sforza وآخرون. 1994 Hoerder 2002). حتى مع وجود عدد كبير من الواسمات ، فإن المعلومات الخاصة بتقدير نسب الخليط للأفراد أو المجموعات محدودة ، وعادة ما يكون للتقديرات فترات ثقة واسعة (Pfaff وآخرون. 2004).

تحرير المجموعات الجينية

يمكن استخدام البيانات الجينية لاستنتاج التركيبة السكانية وتعيين الأفراد لمجموعات تتوافق غالبًا مع أصولهم الجغرافية المحددة ذاتيًا. جادل Jorde and Wooding (2004) بأن "تحليل العديد من المواقع ينتج الآن تقديرات دقيقة بشكل معقول للتشابه الجيني بين الأفراد ، بدلاً من المجموعات السكانية. يرتبط تجميع الأفراد بالأصل الجغرافي أو النسب." [10] ومع ذلك ، فإن تحديد الهوية حسب الأصل الجغرافي قد ينهار بسرعة عند النظر في السلالة التاريخية المشتركة بين الأفراد في الزمن. [67]

تم نشر تحليل لبيانات الكروموسومات الجسدية SNP من مشروع HapMap الدولي (المرحلة الثانية) وعينات لوحة تنوع الجينوم البشري CEPH في عام 2009. واقترحت دراسة 53 مجموعة مأخوذة من بيانات HapMap و CEPH (1138 فردًا غير مرتبطين) أن الانتقاء الطبيعي قد يشكل الجينوم البشري أبطأ بكثير مما كان يعتقد سابقًا ، مع عوامل مثل الهجرة داخل وبين القارات التي تؤثر بشكل أكبر على توزيع الاختلافات الجينية. [68] وجدت دراسة مماثلة نُشرت في عام 2010 دليلًا قويًا على نطاق الجينوم على الاختيار بسبب التغيرات في المنطقة البيئية والنظام الغذائي والمعيشة خاصة فيما يتعلق بالمناطق البيئية القطبية ، مع البحث عن الطعام والنظام الغذائي الغني بالجذور والدرنات. [69] في دراسة أجريت عام 2016 ، كان تحليل المكون الرئيسي للبيانات على مستوى الجينوم قادرًا على استعادة الأهداف المعروفة سابقًا للاختيار الإيجابي (بدون تعريف مسبق للسكان) بالإضافة إلى عدد من الجينات المرشحة الجديدة. [70]

تحرير أنثروبولوجيا الطب الشرعي

يمكن لعلماء الأنثروبولوجيا الشرعيين تقييم أصل بقايا الهياكل العظمية من خلال تحليل مورفولوجيا الهيكل العظمي وكذلك استخدام العلامات الجينية والكيميائية ، عند الإمكان. [71] على الرغم من أن هذه التقييمات غير مؤكدة أبدًا ، فقد قدرت دقة تحليلات مورفولوجيا الهيكل العظمي في تحديد الأصل الحقيقي بحوالي 90٪. [72]

تدفق الجينات وتحرير الخليط

يقلل تدفق الجينات بين مجموعتين من السكان من متوسط ​​المسافة الجينية بين السكان ، فقط المجموعات البشرية المعزولة تمامًا لا تعاني من تدفق الجينات ومعظم السكان لديهم تدفق جيني مستمر مع مجموعات سكانية مجاورة أخرى مما يخلق التوزيع الكليني الملاحظ للتنوع الجيني للعثة. عندما يحدث تدفق الجينات بين مجموعات جينية متمايزة جيدًا ، يُشار إلى النتيجة باسم "المزيج الجيني".

رسم الخرائط المختلطة هي تقنية تستخدم لدراسة كيف تسبب المتغيرات الجينية اختلافات في معدلات المرض بين السكان. [73] تعتبر المجموعات المختلطة الحديثة التي تتبع أسلافها إلى قارات متعددة مناسبة تمامًا لتحديد جينات السمات والأمراض التي تختلف في انتشارها بين السكان الأبوين. كان السكان الأمريكيون من أصل أفريقي محورًا للعديد من دراسات رسم الخرائط الوراثية والمختلط للسكان ، بما في ذلك دراسات السمات الوراثية المعقدة مثل عدد الخلايا البيضاء ومؤشر كتلة الجسم وسرطان البروستاتا وأمراض الكلى. [74]

تم إجراء تحليل للتباين الظاهري والجيني بما في ذلك لون البشرة والوضع الاجتماعي والاقتصادي في سكان الرأس الأخضر الذين لديهم تاريخ موثق جيدًا للاتصال بين الأوروبيين والأفارقة. أظهرت الدراسات أن نمط المزج في هذه الفئة من السكان متحيز جنسياً وأن هناك تفاعلات كبيرة بين الحالة الاجتماعية والاقتصادية ولون البشرة بغض النظر عن لون الجلد والأصل. [75] أظهرت دراسة أخرى زيادة خطر حدوث مضاعفات مرض الكسب غير المشروع مقابل المضيف بعد الزرع بسبب المتغيرات الجينية في مستضد كريات الدم البيضاء البشرية (HLA) والبروتينات غير HLA. [76]

تساهم الفروق في ترددات الأليل في حدوث فروق جماعية في حدوث بعض الأمراض أحادية الجين ، وقد تساهم في حدوث اختلافات في حدوث بعض الأمراض الشائعة. [77] بالنسبة للأمراض أحادية الجين ، فإن تواتر الأليلات المسببة عادة ما يرتبط بشكل أفضل بالنسب ، سواء أكان عائليًا (على سبيل المثال ، متلازمة إليس فان كريفيلد بين أميش بنسلفانيا) ، أو الإثني (مرض تاي ساكس بين السكان اليهود الأشكناز) ، أو الجغرافي (اعتلالات الهيموغلوبين بين الأشخاص من أسلاف الذين عاشوا في مناطق الملاريا). إلى الحد الذي يتوافق فيه السلالة مع المجموعات العرقية أو الإثنية أو المجموعات الفرعية ، يمكن أن يختلف حدوث الأمراض أحادية الجين بين المجموعات المصنفة حسب العرق أو العرق ، وعادة ما يأخذ أخصائيو الرعاية الصحية هذه الأنماط في الاعتبار عند إجراء التشخيص. [78]

حتى مع الأمراض الشائعة التي تنطوي على العديد من المتغيرات الجينية والعوامل البيئية ، يشير الباحثون إلى أدلة تشير إلى تورط الأليلات الموزعة تفاضليًا مع تأثيرات صغيرة إلى متوسطة. تشمل الأمثلة التي يتم الاستشهاد بها بشكل متكرر ارتفاع ضغط الدم (Douglas وآخرون. 1996) ، ومرض السكري (جاور وآخرون. 2003) ، السمنة (فرنانديز وآخرون. 2003) ، وسرطان البروستاتا (Platz وآخرون. 2000). ومع ذلك ، في أي من هذه الحالات ، لم يظهر التباين الأليلي في جين القابلية للتأثر بجزء كبير من الاختلاف في انتشار المرض بين المجموعات ، ولا يزال دور العوامل الوراثية في توليد هذه الاختلافات غير مؤكد (Mountain and Risch 2004).

من ناحية أخرى ، فإن بعض الاختلافات الأخرى مفيدة للإنسان ، لأنها تمنع بعض الأمراض وتزيد من فرصة التكيف مع البيئة. على سبيل المثال ، طفرة في الجين CCR5 الذي يحمي من الإيدز. الجين CCR5 غائب على سطح الخلية بسبب الطفرة. بدون وجود الجين CCR5 على السطح ، لا يوجد شيء يمكن لفيروسات فيروس نقص المناعة البشرية الإمساك به والالتزام به. لذلك ، فإن الطفرة في جين CCR5 تقلل من فرصة تعرض الفرد للإصابة بالإيدز. الطفرة في CCR5 هي أيضًا شائعة جدًا في مناطق معينة ، حيث يحمل أكثر من 14 ٪ من السكان الطفرة في أوروبا وحوالي 6-10 ٪ في آسيا وشمال إفريقيا. [79]

بصرف النظر عن الطفرات ، فإن العديد من الجينات التي قد تكون ساعدت البشر في العصور القديمة تصيب البشر اليوم. على سبيل المثال ، يُشتبه في أن الجينات التي تسمح للبشر بمعالجة الطعام بكفاءة أكبر هي تلك التي تجعل الناس عرضة للسمنة ومرض السكري اليوم. [80]

اقترح نيل ريش من جامعة ستانفورد أن العرق / المجموعة العرقية المحددة ذاتيًا يمكن أن تكون وسيلة صالحة للتصنيف في الولايات المتحدة لاعتبارات الصحة العامة والسياسة. [81] [77] ورقة عام 2002 من قبل مجموعة نوح روزنبرغ تقدم ادعاءً مشابهًا: "إن بنية السكان البشريين ذات صلة في مختلف السياقات الوبائية. ونتيجة للاختلاف في تواتر كل من عوامل الخطر الوراثية وغير الوراثية ، ومعدلات المرض و من هذه الأنماط الظاهرية مثل الاستجابة العكسية للأدوية تختلف باختلاف السكان. علاوة على ذلك ، قد توفر المعلومات حول السكان الأصليين للمريض لممارسي الرعاية الصحية معلومات حول المخاطر عندما تكون الأسباب المباشرة للمرض غير معروفة ". [82] ومع ذلك ، في عام 2018 ، أصدر نوح روزنبرغ دراسة تجادل ضد الأفكار الجينية الجينية للتفاوتات الصحية بين السكان قائلة إن المتغيرات البيئية هي السبب الأكثر ترجيحًا تفسير الدرجات متعددة الجينات والتكيف متعدد الجينات والاختلافات المظهرية البشرية

مشاريع الجينوم البشري هي مساعي علمية تحدد أو تدرس بنية الجينوم البشري. كان مشروع الجينوم البشري مشروع جينوم تاريخي.


المواد والأساليب

اكتشاف SNP

كانت طرق الاكتشاف تكرارية وتكييفها لمجموعات بيانات النسخ المختلفة عند ظهورها من مختبرنا. أولاً ، تم اختيار المواد الأولية مباشرة من سمك السلمون الصديق (يا كيتا) 454 تجمعًا [37]. تم اختيار بادئات SNP إضافية من مجموعات تسلسل SOLiD من سمك السلمون sockeye [38]. نشأت هذه التسلسلات الأخيرة من 10 أسماك من خمسة مواقع (الشكل 1 الدوائر الحمراء الجدول 1).

انظر الجدول 1 لمعرفة أسماء المواقع المقابلة للأرقام. تم تمييز سلمون Sockeye الذي تم جمعه لتسلسل SOLiD والتأكد الأولي من SNP [38] بدوائر حمراء. يتم تمييز العينات التي تم جمعها للتحقق من صحة SNP بدوائر زرقاء. المجموعات المستخدمة لتقييم وتصنيف SNP في جميع مواقع SNP البالغ عددها 114 موضحة بالماس الأخضر.

الجدول 1

تطبيقمنطقةخريطة #موقعن
اكتشاف SNPبريستول باي ، ألاسكا1ياكو كريك2
التأكد2شاطئ ياكو2
3شاطئ خليج سيلفرهورن2
4بحيرة كوليك2
جنوب وسط ألاسكا5ميندلتنا كريك2
اكتشاف SNPشبه جزيرة كامتشاتكا6نهر حبيزا8
تصديقبريستول باي ، ألاسكا7دير كريك8
8نهر تكجيك8
9نوشاكاك-كلوتابوك كريك العلوي8
10بيك كريك8
11أبر تالاريك كريك8
12رافد بحيرة أواليك8
13بشروف كريك8
14مارجوت كريك8
شبه جزيرة ألاسكا15Hatchery Beach، Chignik8
16برود كريك8
17نهر السندر8
18بحيرة بير8
19نهر ميشيك8
جنوب وسط ألاسكا20سلاج نهر ينتنا8
21سلاج نهر سوسيتنا8
22بحيرة كوجيل8
جنوب شرق ألاسكا23نهر كلوكشو ، ألسك8
24هيو سميث ليك8
25بحيرة ماكدونالد8
كولومبيا البريطانية ، كندا26نهر سكود8
27نهر تاكو الرئيسي8
28بحيرة سلامغيش8
29شاطئ بحيرة مزيادين8
تقييم SNPشبه جزيرة كامتشاتكا30نهر بولشايا90
31نهر أوزيرنايا93
بريستول باي ، ألاسكا32بحيرة كوليك68
33بيك كريك84
شبه جزيرة ألاسكا34بحيرة بير93
35نهر السندر89
جنوب وسط ألاسكا36بحيرة كوجيل89
37مين باي61
كولومبيا البريطانية ، كندا38أعلى نهر تاتشينشيني88
39Damdochax كريك85
واشنطن40Issaquah كريك87
41بحيرة بيكر93

تم تصميم واختبار المواد الأولية لتضخيم تفاعل البوليميراز المتسلسل لمنتج واحد على عينة واحدة مجمعة من الحمض النووي. تم استخدام البادئات الناجحة بعد ذلك لفحص الأفراد بحثًا عن تعدد الأشكال باستخدام HRMA كما في McGlauflin et al. [31]. تم إجراء HRMA باتباع إرشادات الشركة المصنعة على منصة Lightcycler 480 (Roche Diagnostics) باستخدام ثمانية أسماك اختبار من كل موقع من مواقع 24 (إجمالي 192 سمكة الشكل 1 الدوائر الزرقاء الجدول 1).تم اختيار هذه المواقع للتركيز على سكان خليج بريستول وتضم أيضًا عددًا قليلاً من الممثلين من شرق وغرب المحيط الهادئ.

تم اختيار SNPs المفترضة التي تم اكتشافها بنجاح باستخدام HRMA لتسلسل Sanger. تم استخدام التسلسلات التي تم فيها تأكيد هوية SNP من خلال وجود نمطين وراثيين على الأقل لتصميم البادئات والتحقيقات لمقايسات نوكلياز 5 & # x02032. كخطوة تحقق نهائية ، تم بعد ذلك اختبار كل اختبار عن طريق التنميط الجيني لنفس اللوحة المكونة من 192 سمكة التي تم استخدامها في HRMA. تم تجاهل المقايسات التي لم تحقق أداءً جيدًا أو التي انحرف فيها SNP عن توقعات هاردي-واينبرغ (HWE) (تم اختبار HWE على مجموعة فرعية من المجموعات السكانية التي امتلكنا منها عينات إضافية من (N & # x0200a = & # x0200a61 & # x0201395). تم استخدام تسلسلات سانجر المستخدمة في تصميم مقايسة 5 & # x02032-nuclease للتعليق على العلامات التي تم التحقق من صحتها باستخدام قاعدة بيانات تسلسل NCBI و Blastx. تم وضع تعليقات توضيحية فقط على المقايسات التي تحتوي على تسلسل أكثر تشابهًا بقيمة إلكترونية & # x0003c1.0E-10.

تقييم SNP

تم اختيار ستة أزواج من عينات السكان (يشار إليها فيما يلي باسم مجموعات التقييم) من جميع أنحاء نطاق الأنواع لتقييم التباين داخل المنطقة وفيما بينها (الشكل 1 الماس الأخضر الجدول 1). تم تنميط جميع الأسماك من مجموعات التقييم الـ 12 في 114 موقعًا نوويًا (الجدول S1) باستخدام مقايسات نوكلياز 5 & # x02032 [34]. تضمنت هذه الأشكال النيوكلوتايدية SNPs 43 جديدة موصوفة في هذه الورقة ، و 68 من الأشكال المتعددة الأشكال المنشورة سابقًا لسمك السلمون السوكي [14] ، [29] ، [39] ، [40] وثلاثة علامات غير منشورة من قسم مصايد الأسماك والمحيطات بكندا (مختبر الوراثة الجزيئية ، محطة المحيط الهادئ البيولوجية ، إدارة مصايد الأسماك والمحيطات بكندا).

تم الحصول على الأنسجة (القلب أو الكبد أو الزعنفة أو العملية الإبطية) أو الحمض النووي الجيني من العينات المؤرشفة في جامعة واشنطن (UW) ، وإدارة الأسماك والألعاب في ألاسكا (ADF & # x00026G) ، وإدارة الأسماك والحياة البرية بواشنطن. (WDFW). تم استخراج الحمض النووي الجيني حسب الضرورة باستخدام مجموعة الدم والأنسجة DNeasy96 (QIAGEN ، الولايات المتحدة الأمريكية).

تم تقييم العلامات أولاً باستخدام المؤشرات الوراثية السكانية القياسية باستخدام مجموعات التقييم الـ 12 (الجدول 1) على النحو التالي. تم اختبار السكان للانحرافات عن HWE في كل موقع باستخدام اختبارات خي مربع كما هو مطبق في GenAlEx 6.2 [41]. تم تصحيح جميع القيم الحرجة لمقارنات متعددة باستخدام تصحيح Bonferroni المتسلسل [42]. تم حساب الثراء الأليلي لكل موقع في كل مجموعة باستخدام FSTAT v.2.9.3.2 [43] للبحث عن تأثيرات تحيز التأكيد. تم اختبار الفروق في متوسط ​​الثراء الأليلي بين المواقع من أجل الأهمية باستخدام ANOVA. تم اختبار اختلال التوازن في كل مجموعة لكل زوج من تعدد الأشكال باستخدام Genepop 4 [44]. للتحقق من وجود خطأ في التنميط الجيني ، تم تنميط 8٪ من كل مجموعة مرة أخرى.

تم قياس التمايز السكاني على أنه Fشارع [32] في كل مكان باستخدام Genepop 4 وبين أزواج السكان عبر جميع المواقع باستخدام Arlequin 3.5 [45]. تم إجراء تحليل إحداثيات رئيسي بستة إحداثيات في GenAlEx لتصور العلاقة الجينية بين السكان. تم استخدام Arlequin أيضًا لاكتشاف المواقع البعيدة ، والمرشحين للاختيار الاتجاهي [46] ، عبر النطاق بأكمله باستخدام نموذج الجزيرة الهرمي بستة مناطق (الجدول 1) ، و 20000 محاكاة ، و 100 ديميس ، و 50 مجموعة. استند اكتشاف المواقع المرشحة إلى عمل Beaumont و Nichols الأصلي باستخدام تغاير الزيجوت والتمايز العالي لتحديد المواقع الخارجية [47]. تم التحقيق في قيمة هذه المواقع النائية لحل السكان عن طريق إزالة هذه المواقع من مجموعة البيانات ثم إعادة قياس التمايز الجيني بين السكان. تم اختبار أهمية الاختلافات في التمايز الجيني المقاس باستخدام مواضع خارجية وبدون مواضع خارجية باستخدام اختبار Mantel.

ترتيب SNP

تم ترتيب كل موضع وفقًا لخمسة مقاييس: F.شارع [32] ، المعلوماتية كما حسبها روزنبرغ (I.ن [33]) ، متوسط ​​مساهمة المكان في تحليل المكون الرئيسي (LC) ، ترتيب BELS [20] ، و WHICHLOCI [19]. بالإضافة إلى ذلك ، نظرنا في نهج الترتيب GAFS من Topchy et al. [48] ​​لم يتم تنفيذ GAFS بسبب تشابهها مع BELS والتكاليف الحسابية [17]. يتم تلخيص كل طريقة مستخدمة في الجدول 2. Fشارعو LC وأنان كلها مقاييس للتنوع الجيني تعتمد على الاختلافات في ترددات الأليل التي لوحظت في مكان ما ، في حين أن BELS و WHICHLOCI عبارة عن درجات تستند إلى تعظيم احتمالية تعيين النمط الجيني للسكان الصحيحين. المعلوماتية (أنان) تم إثبات ارتباطه بـ Fشارع بواسطة Rosenberg et al. [33]. تم تحديد علاقة المعلوماتية بـ LC باستخدام ارتباط رتبة سبيرمان. تم تحديد LC باستخدام طريقة المقارنة الموضعية متعددة المتغيرات التي طورها Moazami-Goudarzi و Lalo & # x000eb [49] وتم تنفيذها في S-Plus (MathSoft ، Inc ، 2000). هنا ، تم تحديد مساهمة الموقع للمكونات الخمسة الرئيسية الأولى.

الجدول 2

نهج الترتيبوصفالمرجعي
Fشارعالتباين المتدرج بين السكان في تردد الأليلWeir & # x00026 Cockerham 1984
مساهمة الموقع (LC)متوسط ​​مساهمة كل موقع في المكونات الرئيسيةMoazami-Goudarzi & # x00026 Lalo & # x000eb 2002
المعلوماتية للتعيين (I.ن)تقدير احتمالية تخصيص أليل لمجموعة واحدة مقارنة بمتوسط ​​عدد السكانروزنبرغ وآخرون. 2003
بيلسيصنف أداء الموقع لتعظيم دقة تقدير الخليط أثناء التعيين الفرديبروماجين 2008
ويتشلوسييحدد كفاءة الموقع لتعيين السكان الصحيح والميل للتسبب في تعيين خاطئبانكس وآخرون. 2003

توفر BELS و WHICHLOCI لكل موقع رتبة بناءً على دقة التخصيص الفردي لهذا المكان والقيمة المفقودة عند إزالة الموضع من اللوحة بطريقة سكين الرافعة. الروابط التي تؤدي إلى أكبر خسارة في أداء الواجب الفردي عند إزالتها تتلقى أعلى الدرجات. تم تشغيل كل من برامج تصنيف المواقع هذه مع إعادة أخذ العينات لحجم سكانية محاكى يبلغ 200 فرد و 250 تكرارًا. لم يتم تحديد السكان الحرجين. في WHICHLOCI ، تم تعيين الحد الأدنى للتعيين الصحيح عند 95.0٪. في BELS ، تم تعيين مقياس الأداء لتعظيم متوسط ​​دقة التعيين الفردي من أجل التعيين الصحيح بنسبة 100٪. بالنسبة إلى BELS ، تم استكشاف دور ترتيب الإدخال الموضعي من خلال تشغيل التحليلات بأربعة أوامر موقع مختلفة: أبجديًا ، وأبجديًا عكسيًا ، وأمران موضعيان تم إنشاؤهما عشوائيًا. تم اختبار الفروق في الرتب الموضعية لكل طلب إدخال بطريقة زوجية باستخدام اختبار Wilcoxon Signed Rank.

في البداية ، تم تصنيف كل موقع باستخدام جميع الأفراد المتاحين (مجموعة كاملة) لمجموعات تقييم SNP الاثني عشر (الجدول 1). ومع ذلك ، لتقليل احتمالية التحيز التصاعدي الذي تم تقديمه عند تصنيف المواقع وتقييمها باستخدام نفس الأفراد ، تم تنفيذ أسلوب أندرسون البسيط للتدريب والانتظار [22]. تم اختيار نصف كل مجتمع تقييم عشوائيًا لترتيب الموقع (مجموعة التدريب). بالنسبة لحجم السكان ذي الأرقام الفردية ، تم تعيين الفرد الإضافي في مجموعة التدريب. تم حجز الأفراد المتبقين (مجموعة الانتظار) لاختبار اللوحة. تم اختبار أهمية الاختلافات في الرتب المحلية باستخدام مجموعة السكان الكاملة ومجموعة تدريب السكان باستخدام اختبار تصنيف موقع ويلكوكسون.

اختبار اللوحة

تم تصميم لوحات SNP لتقييم قيمة زيادة عدد العلامات المضمنة في لوحة وتقييم المقاييس المختلفة لتصنيف تعدد الأشكال باستخدام مجموعات التقييم الـ 12. تم اختيار حجمين للوحة ، 48 و 96 SNPs ، لاختبار الاختلافات في حل الطاقة عند زيادة عدد العلامات. تمثل أحجام اللوحات هذه قدرات منصات التنميط الجيني عالية الإنتاجية التي يشيع استخدامها في ذلك الوقت (على سبيل المثال [35]).

قمنا بتجميع سبعة أزواج من ألواح 48-SNP و 96-SNP. باستخدام مجموعة التدريب ، تم إنشاء خمسة أزواج من أفضل المواقع مرتبة لكل مقياس موضعي. تم إنشاء زوج سادس من اللوحات من أعلى المواقع مرتبة (بناءً على متوسط ​​رتبهم). أخيرًا ، تم إنشاء زوج سابع من اللوحات من مواقع تم اختيارها عشوائيًا.

تم اختبار أداء كل لوحة بطريقتين مختلفتين. باستخدام برنامج ONCOR [50] ، تم إجراء اختبارات التخصيص لتعيين مجموعة من الأفراد الرافضين من كل مجموعة تقييم (الجدول 1) إلى خط الأساس لمجموعة التدريب للأفراد التي تم استخدامها لتصنيف SNP. نظرًا لأن أصل الأفراد المعينين كان معروفًا ، فقد تم الإبلاغ عن احتمالية التعيين لسكان المنشأ من أجل دقة التعيين. كانت الطريقة الثانية المستخدمة لتقييم أداء اللوحة هي محاكاة التخصيص الفردي الذي وصفه Rosenberg [36] كما تم تنفيذه بواسطة Ackerman et al. [51]. تستخدم هذه المحاكاة ترددات الأليل للسكان الموصوفين من قبل المستخدم لتعيين فرد تمت محاكاته إلى المجتمع الصحيح والإبلاغ عن احتمالية صحة هذا التعيين. هنا تم محاكاة الأفراد باستخدام ترددات الأليل من مجموعة الأفراد الرافضة لكل مجموعة. لكل لوحة ، تمت محاكاة التخصيص الفردي 500 مرة مع 1000 فرد في R ، وتكرار التخصيص الصحيح (F أوركا [36]).

تم اختبار الفروق في أداء اللوحة لكل من طريقتين التقييم لاستخدام ANOVA واختبار الفروق الهامة بصدق Tukey اللاحق (& # x003b1 & # x0200a = & # x0200a0.01).

بالإضافة إلى اختبار اللوحة ، قمنا بفحص قيمة استخدام المجموعة الكاملة للمواقع والتغيير في دقة التعيين مع تقليل حجم اللوحة بعد الإزالة اللاحقة للموقع. بدءًا من المجموعة الكاملة المكونة من 110 موقع متعدد الأشكال ، تم استخدام ONCOR لتحديد احتمالية التعيين الصحيح بشكل مشابه لتقييم لوحة 96- و 48- SNP. تم بعد ذلك استبعاد خمسة مواقع في وقت واحد بأدنى متوسط ​​رتبة (الجدول S1) حتى بقيت المواقع الخمسة الأولى فقط للمهمة الفردية. تم حساب القيم المتوسطة والربيع الأول والثالث من الاحتمالات الناتجة في Excel (Microsoft for Macs 2011).


التفاعلات والمتلازمات السلوكية

الملاحظات الميدانية لسلوك الزرد قليلة وقصصية ، والكثير مما يفعله الزرد في الطبيعة يجب استنتاجه من سلوكه في المختبر. أحد السلوكيات التي حظيت باهتمام كبير هو تكوين تجمعات اجتماعية فضفاضة ، أو المياه الضحلة ، التي لوحظت في الميدان (انظر الشكل 1 ج) ودُرست في المختبر (Engeszer et al.، 2007b Gerlai، 2014). قد يوفر هذا السلوك الحماية من الحيوانات المفترسة ، أو تحسين النجاح في البحث عن الطعام ، أو الوصول إلى الأصدقاء. يزداد التسرب بشكل مطرد من مراحل اليرقات المبكرة ، و "بصمة" الأفراد على نمط ظاهري بصري معين ، مما يدل على تفضيل هذا النمط الظاهري بحلول الوقت الذي يكونون فيه صغارًا (Engeszer et al. ، 2004 ، 2007a Spence and Smith ، 2007 Mahabir et al. ، 2013). ومن المثير للاهتمام ، أن الأسماك التي يتم صيدها من البرية وأسماك المختبر (كلاهما مطبوع مسبقًا على `` النوع البري '') لها تفضيلات مماثلة لشركاء المياه الضحلة المحتملين عند تقديمها مع الأسماك التي لها أنماط صبغية مختلفة وأنماط ظاهرية أخرى ، على الرغم من اختلاف الخصائص بين الجنسين: يبدو أن تفضيلات الإناث تكون معقدة ، في حين يظهر الذكور تفضيلات قوية ترتبط بجودة الشريط وهوية الأنواع (Engeszer et al. ، 2008). قد تؤثر العديد من العوامل الإضافية أيضًا على ما إذا كانت أسماك الزرد ضحلة معًا في البرية أم لا ، بما في ذلك حجم الأسماك ، وحجم المجموعة ، ونسبة الجنس ، ومنبهات الشم ، والتعرف على الأقارب ، ومخاطر الافتراس ونظام الضوء (على سبيل المثال ، Pritchard et al. ، 2001 Gerlach and Lysiak ، 2006 Ruhl et al. ، 2009).

تفرخ سلالات المختبر من سمك الزرد على مدار السنة ، ولكن التكاثر في البرية يحدث بشكل أساسي خلال الرياح الموسمية الصيفية ، عندما تظهر برك سريعة الزوال ، من المفترض أنها توفر الكثير من الطعام وبعض المأوى من التيارات والحيوانات المفترسة. قد تسهل المياه الراكدة أيضًا الاتصال الفروموني ذي الصلة بتكوين البويضات والتودد (Bloom and Perlmutter، 1977 van den Hurk and Lambert، 1983 van den Hurk et al.، 1987 Gerlach، 2006). يميل التبويض إلى الحدوث قرب الفجر ، ويمكن أن يشمل مناطق الذكور ، بالإضافة إلى تفضيلات الإناث لمواقع وضع البيض (وضع البيض) (سبينس وآخرون ، 2007 أ ، 2008). تشير الدراسات المعملية إلى أن سلوكيات الخطوبة والتزاوج هي نمطية ، على الرغم من أن بعض التفاصيل قد تعتمد على الظروف التي تم فيها إجراء الملاحظات. تشمل السلوكيات النهج الأولي الذي يطارد من قبل الذكر ويلامس أنف الذكر إلى جانب الأنثى أو يدور ذيل الذكر وترتجف الأنثى التي تقود الذكر إلى موقع بيضوي ، أو يقوم الذكر بتثبيت الأنثى على شيء ووضع البيض نفسه (دارو و Harris، 2004 Sessa et al.، 2008 Kang et al.، 2013). يمكن للإناث أن تضع ما يصل إلى عدة مئات من البيض في وقت واحد ، أو أعداد أقل كل بضعة أيام ، ولكن العدد الفعلي للنسل من أي تفريخ متغير بدرجة كبيرة. في الواقع ، يمكن أن يختلف الذكور في أحجام القابض التي يستخرجونها من الإناث ، (سبينس وسميث ، 2006) ، ربما بسبب الاختلافات في حجم الجسم (سكينر ووات ، 2007) يمكن أن تؤثر التسلسلات الهرمية للهيمنة أيضًا على النجاح الإنجابي (Paull et al. ، 2010 ). على الرغم من أنه يمكن الوصول إلى مرحلة النضج الإنجابي في أقل من 4-6 أسابيع في المختبر ، حيث من المعروف أن أسماك الزرد تعيش لمدة تصل إلى عدة سنوات ، إلا أننا لا نعرف حتى الآن توقيت نضجها أو طول عمرها في البرية. سيكون الفهم الأعمق للمغازلة وتفضيلات التربية ، بالإضافة إلى تاريخ الحياة في الطبيعة ، أمرًا مثيرًا للاهتمام ، وقد يسهل البحث في المختبر من خلال تحسين كفاءة التفريخ والتربية (Sessa et al. ، 2008 Adatto et al. ، 2011 Nasiadka and كلارك ، 2012).

في الآونة الأخيرة ، قدم سمك الزرد البري الذي تم إحضاره إلى المختبر رؤى جديدة حول المتلازمات السلوكية ، حيث تتنوع السلوكيات ، كما هو الحال في سلسلة متصلة من الجرأة والعدوانية ، أو التغييرات المرتبطة التي تحدث أثناء التدجين (على سبيل المثال ، التغييرات في كل من الخوف وأنماط النشاط ) التي من المحتمل أن تكون مستمدة من الانتقاء المتعمد لبعض السمات والاختيار المريح لبعض السمات (Moretz et al.، 2007 Norton et al.، 2011). يؤدي تضمين الزرد البري في مثل هذه الدراسات إلى توسيع نطاق التباين بشكل كبير. في الواقع ، كشفت المقارنات بين أسماك الزرد المعزولة من مناطق جغرافية مختلفة ، وسلالات مختبرية مختلفة ، عن اختلافات مذهلة في المتلازمات السلوكية بين السكان (Robison and Rowland، 2005 Oswald and Robison، 2008 Drew et al.، 2012 Martins and Bhat، 2014). أن مثل هذه الاختلافات يمكن أن تكون وراثية (Wright et al.، 2006 Oswald et al.، 2013) تشير إلى أن الأسس الجينية للتنوع الطبيعي في المتلازمات السلوكية ، وتطور السمات السلوكية بشكل عام ، يمكن دراستها باستخدام هذا النوع. من الأهمية بمكان لجميع هذه المساعي الملاحظات والتجارب الإضافية في هذا المجال ، من أجل فهم أفضل للذخيرة السلوكية لأسماك الزرد وأهميتها بالنسبة للياقة الفردية ، وأيضًا لتحديد مدى تأثير اختلافات الموائل بين المجال والمختبر على منطقتنا. القدرة على تعميم النتائج من سياق إلى آخر.


# التوقيع في SNPs

في السابق ، قمنا برسم تشبيه موسع بين كيفية تشكل الأنواع وكيف تتغير اللغات بمرور الوقت. من خلال هذا القياس توصلنا إلى فهم أن الأنواع ، مثل المجموعة التي تتحدث لغة ما ، هي تجمعات مستمرة تغير خصائصها تدريجياً بمرور الوقت. من هذا القياس خلصنا إلى أن "الأنواع" هي تسمية ملائمة لما هو في الواقع مجتمع يمر بتغير تدريجي مستمر - تمامًا كما أن "اللغة" ليست ثابتة ولكنها في حالة تغير مستمر ، وإن كان تدريجيًا. من خلال هذا الفهم ، نحن على استعداد لبدء فحص الجينوم لدينا مع وضع الأفكار الصحيحة في الاعتبار. السؤال ليس ، إذن "متى بدأ جنسنا البشري؟" ، لأن هذا السؤال يشبه السؤال عن متى بدأت "الإنجليزية". ومع ذلك ، فإن ما يمكن للوراثة معالجته هو عدد الأفراد الذين كانوا في مجتمع أسلافنا حيث انفصلوا عن الأنواع الأخرى وأصبحوا سلالة مميزة. هناك عدد من الأساليب الجينية التي تسمح بمثل هذه التقديرات ، وسندرس القليل منها في هذه السلسلة. الأهم من ذلك ، أن جميع الطرق تُظهر تقديرات متشابهة جدًا - أن عدد السكان الموروث من أجدادنا لم ينخفض ​​إلى أقل من حوالي 10000 فرد على مدار عدة ملايين من السنين الماضية. نظرًا لوجود أقدم البشر المعاصرين تشريحياً في السجل الأحفوري منذ 200000 عام ، فإن هذا الحد الأدنى من حجم السكان يمتد إلى الوقت الذي "أصبحنا فيه بشرًا" بيولوجيًا.

التباين الجيني وحجم السكان

سنقوم بفحص كل طريقة من طرق حجم السكان بناءً على حساباتهم على مقدار التباين الجيني في التجمعات البشرية الحالية. بالنسبة لأي قسم معين من الحمض النووي في الجينوم الخاص بنا ، يمكن لأي شخص الحصول على نسختين فقط منه على الأكثر - أحدهما حصل عليه من والدته ، والآخر من والده. ومع ذلك ، يمكن أن يحتوي عدد كبير من السكان على إصدارات أكثر بكثير من نسختين فقط. إذن ، يرتبط مقدار التباين الجيني في السكان بعدد الأفراد في تلك المجموعة السكانية. في أبسط صوره ، يستخدم كل تقدير لحجم السكان البشريين الأسلاف التباين الجيني الحالي لتقدير عدد الأسلاف المطلوبين لنقل مستوى التباين الملحوظ إلى يومنا هذا. تتطلب كمية كبيرة من التنوعات الجينية الحالية أسلافًا أكثر مما تتطلب كمية صغيرة.

لقد ألقى ظهور تسلسل الجينوم ، كما قد تتوقع ، قدرًا كبيرًا من الضوء على مدى التنوع الجيني الموجود في التجمعات البشرية الحديثة. يأتي أحد المصادر المهمة للتنوع الجيني البشري في شكل ما يُعرف باسم تعدد أشكال النوكليوتيدات المفردة ، أو "تعدد الأشكال" (يُنطق "قصاصات"). "تعدد الأشكال" يعني ببساطة "وجود العديد من الأشكال". SNPs عبارة عن أحرف DNA مفردة متغيرة بين البشر ، ولدينا حوالي 300000 من SNPs الشائعة في جينومنا المكون من 3 مليارات حرف DNA. بعبارة أخرى ، فإن غالبية الجينومات الخاصة بنا متطابقة مع بعضها البعض ، لكن عددًا قليلاً من مواضع أحرف الحمض النووي على كروموسوماتنا متغيرة. ضع في اعتبارك مقطعًا قصيرًا من تسلسل الحمض النووي لستة أفراد مختلفين ، بثلاثة أوضاع متغيرة:

بالنسبة لأي موضع SNP واحد ، هناك أربعة إصدارات ممكنة كحد أقصى (نظرًا لوجود أربعة أحرف DNA). بمجرد أن نفكر في عدد قليل من SNPs مرتبطة ببعضها البعض على نفس الكروموسوم ، يصبح عدد التركيبات الممكنة كبيرًا جدًا. على سبيل المثال ، بالنسبة لـ SNPs الثلاثة الموضحة أعلاه فقط ، هناك 64 مجموعة مختلفة ممكنة (4 × 4 × 4 ، أو 4 3). من ناحية أخرى ، سيكون لدى عشرين تعددًا متعدد الكلور (SNPs) 4 20 مجموعة ممكنة ، أي أكثر من عدد الأشخاص على هذا الكوكب. بالنسبة إلى الأفراد الستة أعلاه ، يمكننا أن نرى أن هناك خمس مجموعات مختلفة موجودة. التفسير الأكثر ترجيحًا لهذه المتغيرات الخمسة هو أنها ورثت من خمسة أسلاف مختلفة ، وأن الأشخاص 5 و 6 ورثوا تركيبة متطابقة من نفس السلف.ومع ذلك ، هناك احتمالات أخرى أقل احتمالا: قد تنتج بعض التوليفات من طفرات جديدة ، أو من الاختلاط والمطابقة بين أشكال تعدد الأشكال المختلفة. على سبيل المثال ، يختلف الشخص 4 والأشخاص 5 و 6 بحرف واحد فقط: الشخص 4 لديه "أ" لـ SNP 1 بينما الأشخاص 5 و 6 لديهم "t". أحد الاحتمالات التي نحتاج إلى تفسيرها هو أن الشخص 4 قد ينحدر من نفس السلف مثل الأشخاص 5 و 6 ، لكن طفرة جديدة من t → a حدثت في موقع SNP 1. الاحتمال الآخر هو أنه كان هناك إعادة تركيب ، من خلال عملية تسمى "العبور" ، والتي وضعت "t" في هذا الوضع شخصيًا 4. لذلك ، عند استخدام تباين SNP لحساب عدد الأسلاف المحتملين ، نحتاج إلى عامل الطفرة ومعدلات إعادة التركيب ، وكلاهما يمكننا قياسه مباشرة في البشر. في الممارسة العملية ، تكون تأثيرات الطفرات صغيرة عند استخدام تعدد الأشكال لتقدير أحجام السكان الأسلاف ، نظرًا لأن معدل الطفرات في البشر منخفض جدًا جدًا. تم إجراء قياسات مباشرة للمعدل عن طريق تسلسل الجينوم الكامل للآباء والأبناء ، وفي المتوسط ​​لا يوجد سوى حوالي 100 - 150 طفرة جديدة في كل مرة نقوم فيها بنسخ الجينوم الخاص بنا المكون من ثلاثة مليارات حرف DNA. يمكن أيضًا تقليل تأثيرات إعادة التركيب عن طريق اختيار SNPs التي ترتبط ارتباطًا وثيقًا ببعضها البعض على نفس الكروموسوم. نادرًا ما تتحد النيوكلوتايد التي ترتبط ارتباطًا وثيقًا ببعضها البعض ، نظرًا لوجود مساحة صغيرة جدًا لحدوث العبور بينهما. في حين أن العلماء يأخذون في الاعتبار معدلات الطفرات وإعادة التركيب ، إلا أنهم في الممارسة العملية لا يمثلون مشكلة رئيسية بالنسبة للطرق القائمة على النيوكلوتايد.

من الناحية العملية ، فإن تقديرات حجم السكان بناءً على تباين SNP هي ببساطة مسألة تسلسل عدد كبير من الأشخاص من جميع أنحاء العالم ، وفهرستها لمختلف أشكال النيوكلوتايد ، وتقدير عدد الأسلاف الذين قد يحتاجون إلى تباين SNP الذي نراه في الوقت الحاضر يوم. كما قد تتوقع ، تمتلك مجموعات الأشخاص المختلفة مجموعات مميزة من متغيرات SNP بداخلها. هذا أمر منطقي ، بالطبع ، لأننا نعلم أن المجموعات المختلفة ترتبط ارتباطًا وثيقًا ببعضها البعض أكثر من ارتباطها عبر المجموعات. يؤدي حساب عدد الأسلاف باستخدام هذه الطريقة باستمرار إلى إرجاع إجمالي الحد الأدنى لحجم السكان بحوالي 10000 فرد: هناك حاجة إلى ما يقرب من 8000 أسلاف لشرح تنوع النيوكلوتايد في أفريقيا جنوب الصحراء ، وحوالي 2000 سلف لكل شخص آخر. تنوع SNP في البشر كبير جدًا بحيث لا يمكن أن ينتج عن زوج واحد من الأجداد في أي وقت خلال 200000 سنة الماضية - فنحن ننحدر من مجموعة سكانية. تتوافق هذه القيم أيضًا مع الأساليب الأقدم والأكثر فظًا لتقدير حجم السكان من أنواع أخرى من التباين الجيني ، مما يمنحنا ثقة متزايدة في أنها معقولة.


الخصائص البيولوجية للقيد

لقد بحثنا في خصائص الجينات والنصوص كدالة لتحملها لتباين pLoF (LOEUF). أولاً ، وجدنا أن LOEUF يرتبط بدرجة اتصال الجين في شبكات تفاعل البروتين (ص = −0.14 ص = 1.7 × 10 −51 بعد ضبط طول الجين) (الشكل 4 أ) والتوصيف الوظيفي (البيانات الموسعة الشكل 8 أ). بالإضافة إلى ذلك ، من المرجح أن يتم التعبير عن الجينات المقيدة في كل مكان عبر 38 أنسجة في مشروع التعبير الوراثي عن الأنسجة (GTEx) (الشكل 4 ب) (LOEUF) ص = −0.31 ص & lt 1 × 10 −100) ولديها تعبير أعلى في المتوسط ​​(LOEUF ρ = −0.28 ص & lt 1 × 10 −100) ، بما يتفق مع النتائج السابقة 4. على الرغم من أن معظم النتائج في هذه الدراسة يتم الإبلاغ عنها على مستوى الجينات ، فقد قمنا أيضًا بتوسيع إطار عملنا لحساب LOEUF لجميع نصوص ترميز البروتين ، مما يسمح لنا باستكشاف مدى القيد التفاضلي للنصوص داخل جين معين. في الحالات التي احتوى فيها الجين على نسخ بمستويات متفاوتة من القيد ، وجدنا أن النصوص في أول عشري LOEUF كان من المرجح أن يتم التعبير عنها عبر الأنسجة أكثر من غيرها في نفس الجين (ن = 1740 جينًا) ، حتى عند تعديلها لطول النص (الشكل 4 ج) (تكون النصوص المقيدة في المتوسط ​​6.34 نسخة لكل مليون أعلى ص = 2.2 × 10 14). علاوة على ذلك ، وجدنا أن النص الأكثر تقييدًا لكل جين كان عادةً النص الأكثر تعبيرًا في الأنسجة ذات الصلة بالمرض 24 (البيانات الموسعة الشكل 8 ج) ، مما يدعم الحاجة إلى تفسير المتغير المستند إلى النص ، كما تم استكشافه بمزيد من العمق في مخطوطة مصاحبة 15.

أ، يتم رسم متوسط ​​عدد تفاعلات البروتين والبروتين كدالة لعشر LOEUF: الجينات الأكثر تقييدًا لها شركاء تفاعل أكثر (الانحدار الخطي LOEUF ص = −0.14 ص = 1.7 × 10 −51). أشرطة الخطأ تتوافق مع فترات الثقة 95٪. ب، يتم عرض عدد الأنسجة التي يتم فيها التعبير عن الجين (النسخ لكل مليون & gt 0.3) ، التي تم إهمالها بواسطة LOEUF العشري ، كمؤامرة كمان مع متوسط ​​العدد متراكب كنقاط: من المرجح أن يتم التعبير عن الجينات الأكثر تقييدًا في العديد من الأنسجة ( الانحدار الخطي LOEUF ص = −0.31 ص & lt 1 × 10 −100). ج، بالنسبة لـ 1740 جينًا يوجد فيها على الأقل نص مقيد واحد وآخر غير مقيد ، يتم رسم نسبة التعبير المستمدة من النسخة المقيدة كرسم بياني.

أخيرًا ، قمنا بالتحقيق في الاختلافات المحتملة في LOEUF عبر المجموعات البشرية ، وحصرنا نفس حجم العينة في جميع المجموعات السكانية لإزالة التحيز بسبب القوة التفاضلية لاكتشاف المتغير. نظرًا لأن أصغر عدد من السكان في مجموعة بيانات exome الخاصة بنا (أفريقي / أمريكي من أصل أفريقي) به 8128 فردًا فقط ، فإن قدرتنا على اكتشاف القيود ضد متغيرات pLoF للجينات الفردية محدودة. ومع ذلك ، بالنسبة للجينات ذات القوة الجيدة (توقع pLoF ≥ 10) (معلومات تكميلية) ، لاحظنا انخفاض متوسط ​​النسبة المرصودة / المتوقعة و LOEUF عبر الجينات بين الأفراد الأمريكيين من أصل أفريقي / أفريقي ، وهي مجموعة سكانية ذات حجم سكاني فعال أكبر ، مقارنةً بالآخرين. السكان (البيانات الموسعة الشكل 8 د ، هـ) ، بما يتفق مع زيادة كفاءة الاختيار في التجمعات السكانية ذات الأحجام السكانية الفعالة الأكبر 25،26.


مجموعة عمل علوم البيانات الجينومية

مجموعة العمل الخاصة بعلوم البيانات الجينومية التابعة لـ NHGRI هي لجنة فرعية تابعة للمجلس الاستشاري الوطني لأبحاث الجينوم البشري (NACHGR). تم إنشاء مجموعة العمل في عام 2017 لتسهيل مشاركة أعمق لـ NACHGR في العديد من القضايا المعقدة بشكل متزايد في الواجهة بين علم الجينوم وعلوم البيانات.

مجموعة العمل الخاصة بعلوم البيانات الجينومية التابعة لـ NHGRI هي لجنة فرعية تابعة للمجلس الاستشاري الوطني لأبحاث الجينوم البشري (NACHGR). تم إنشاء مجموعة العمل في عام 2017 لتسهيل مشاركة أعمق لـ NACHGR في العديد من القضايا المعقدة بشكل متزايد في الواجهة بين علم الجينوم وعلوم البيانات.


تنوع المستقرة الخامسا2،الأعلى

هناك أدلة قوية على ذلك الخامسا2،الأعلى يختلف بشكل كبير بين الأشخاص الذين يدعون الامتناع عن ممارسة التمارين الرياضية المنهجية. بوشار وآخرون. (1998) وجدت الخامسا2،الأعلى للتفاوت بأكثر من الضعف بين 429 فردًا مستقلاً من 86 عائلة ، كما ورد في دراسة عائلية رائدة في مجال التراث (الصحة ، عوامل RIsk ، التدريب على التمارين وعلم التحكم الآلي). بوشار وآخرون. (1998) حددت الموضوعات المستقرة على أنها الموضوعات التي لم تشارك في أكثر من جلسة تمرين أسبوعية لمدة 30 دقيقة كحد أقصى في إنفاق طاقة 7 METs للموضوعات 50 سنة و 8 METs للموضوعات و lt50 سنة.

هذا الاختلاف الهائل بين الأفراد في الجلوس الخامسا2،الأعلى يطرح السؤال عن المساهمة الوراثية لهذه السمة المظهرية. كان كليسوراس (1971) أول من درس وراثة الخامسا2،الأعلى بطريقة منهجية ، مقارنة أزواج التوائم أحادية الزيجوت (MZ ، ن= 15) مع أزواج من التوائم ثنائية الزيجوت (DZ ، ن= 10). Klissouras (1971) وجدت الخامسا2،الأعلى أن تكون متطابقة تقريبًا بين MZ و DZ ومع ذلك ، عندما الخامسا2،الأعلى تم تراجع قيم التوائم الزوجي ، معامل الارتباط ص بالنسبة لـ MZ كان 0.91 بينما كان ذلك بالنسبة لـ DZ 0.44 فقط. من هذا ، قام Klissouras (1971) بحساب المكون الوراثي لـ الخامسا2،الأعلى ليكون 0.93.

منذ ذلك الحين ، كان هناك عدد من الدراسات حول التوأم ، كما استعرضها Schutte et al. (2016). أجرى هؤلاء المؤلفون تحليلًا تلويًا مرجحًا بحجم العينة على جميع دراسات التوريث الخاصة باستهلاك الأكسجين الأقصى لدى الأطفال والمراهقين والشباب. وجدوا أن 59٪ (ن= 1088) و 72٪ (ن= 1004) للتغير المقاس الخامسا2،الأعلى أو من الخامسا2،الأعلى نسبة إلى كتلة الجسم (الخامسا2،الأعلى/مب) ، على التوالي ، يمكن تفسيره بالتأثيرات الجينية. بشكل عام ، خلصوا إلى أن العوامل الفطرية تحدد أكثر من 50 ٪ من الاختلافات بين الأفراد في الخامسا2،الأعلى في السكان الذين تم أخذ عينات منهم.

تقديرات الوراثة ل الخامسا2،الأعلى أبلغ عنها شوت وآخرون. (2016) أعلى من تلك التي أبلغ عنها Bouchard et al. (1998) لدراسة عائلة التراث. بوشار وآخرون. (1998) تحليل المستقرة الخامسا2،الأعلى تم الحصول على البيانات من أعضاء 86 عائلة نووية باستخدام إجراءات الانحدار المتعدد التدريجي. تم إجراء تحليل التباين (ANOVA) للتحقق من التجميع العائلي لـ الخامسا2،الأعلى من خلال مقارنة التباين بين الأسرة وداخل الأسرة. أظهر التحليل أن هذا التباين أكبر من 2.6 إلى 2.9 مرة بين العائلات. اعتمادًا على التعديلات (للجنس وكتلة الجسم وكتلة الدهون والكتلة الخالية من الدهون) ، تم حساب تقديرات التوريث بين 51٪ و 59٪. باستخدام نماذج الانحدار المناسبة ، Bouchard et al. (1998) كانوا قادرين أيضًا على حساب مساهمة الأم (الميتوكوندريا) في التوريث العام - أبلغوا عن مساهمة الأمهات بنسبة 29-36٪ (أكثر من نصف إجمالي التوريث). بوشار وآخرون. (1998) تشير إلى تقديرات التوريث هذه على أنها "قصوى" لأن نهجها لم يسمح بعزل وطرح مساهمة البيئة الأسرية في التوريث الكلي.

باختصار ، تشير البيانات المتاحة حاليًا إلى تباين كبير بين الأفراد في المستقرة الخامسا2،الأعلى، تمتد على الأقل إلى نطاق مزدوج بين أدنى وأعلى التقديرات. تشير كل من دراسات الأخوة التوأم ودراسات التشابه الأسري إلى أن ما لا يقل عن 50٪ من هذا التباين هو من أصل وراثي ، مع كون وراثة الأم والميتوكوندريا أكثر من نصف إجمالي الميراث.


دراسات الارتباط على مستوى الجينوم: كيف ترتبط الجينات بالأمراض الشائعة؟

أتاح مشروع الجينوم البشري طرح أنواع جديدة من الأسئلة العلمية والتعامل معها. أحد الأمثلة على مثل هذا السؤال المهم هو تحديد النيوكلوتايد SNPs التي تزيد أو تقلل من خطر الإصابة بمرض معين (تذكر أن SNPs هي قواعد وراثية يمكن أن تختلف بين الناس). قبل HGP ، إذا أراد العلماء الإجابة على هذا النوع من الأسئلة ، فيمكنهم التركيز بشكل واقعي فقط على مناطق صغيرة قليلة من الجينوم في كل مرة. الآن ، سيكون من الممكن نظريًا إجراء تسلسل للعديد من الأشخاص المصابين أو غير المصابين بمرض واختبار كل قاعدة في الجينوم بشكل منهجي ، متسائلين: هل نسخة واحدة من SNP أكثر شيوعًا لدى الأشخاص المصابين بالمرض؟ يسمى هذا النوع من تصميم الدراسة بدراسة الارتباط على مستوى الجينوم (GWAS) (الشكل 3). أحد الاعتبارات المهمة لـ GWAS هو كفاءة التكلفة ، حيث أن تسلسل الجينوم بأكمله لا يزال مكلفًا للغاية لأداء عدد كبير من الناس. لذلك ، غالبًا ما يستخدم العلماء نهجًا أرخص: اختيار مئات الآلاف من SNPs المعروفة مسبقًا واختبار التركيب الوراثي لكل فرد في تلك النيوكلوتايد فقط.

الشكل 3. دراسات الارتباط على مستوى الجينوم. توضح هذه الصورة نظرة عامة على إجراء دراسة الارتباط على مستوى الجينوم (GWAS) ، حيث يجمع العلماء معلومات الحمض النووي من المرضى وعناصر التحكم الصحية ثم يختبرون بشكل منهجي تعدد الأشكال المرتبطة بالإصابة بالمرض محل الاهتمام.

نجح العلماء سابقًا في تحديد الجينات المسببة للعديد من الأمراض النادرة والشديدة ، مثل التليف الكيسي وفقر الدم المنجلي. بالنسبة لهذه الأنواع من الأمراض ، غالبًا ما يمكن تحديد عنصر SNP واحد له تأثير قوي للغاية (على الرغم من أنه من المهم ملاحظة أن اكتشاف الجينات لا يترجم على الفور إلى تطوير دواء علاجي - إنه فقط الخطوة الأولى في عملية طويلة ومعقدة). بدا من الطبيعي أن نأمل أن يثبت GWAS فعاليته بالمثل في تحديد الأساس الجيني للأمراض الأكثر شيوعًا ، مثل أمراض القلب والسكري ومرض التهاب الأمعاء والفصام. لكن في السنوات الأولى من GWAS ، أصبح من الواضح أن الأمور لن تكون بهذه البساطة: أشارت النتائج إلى أن عددًا كبيرًا جدًا من الجينات - بالنسبة لبعض الصفات ، بسهولة تصل إلى المئات أو ربما حتى الآلاف - قد يكون لها تأثيرات على شيء معين. مرض. علاوة على ذلك ، تميل هذه التأثيرات إلى أن تكون صغيرة جدًا لكل SNP (على سبيل المثال ، يرتبط SNP المعين الذي يؤثر على خطر السمنة عادةً باكتساب جزء بسيط من رطل واحد).

كان هذا الاكتشاف المفاهيمي تقدمًا مهمًا في فهمنا لبيولوجيا الإنسان. في سياق تطوير الأدوية ، تعني هذه النتيجة أن استهداف جين واحد بدواء ما قد لا يعالج جميع الأشخاص المصابين بمرض معين ، ويعمل العلماء على استخدام المعلومات المكتسبة من GWAS لتطوير وتحسين العلاجات العلاجية.


أسئلة معلقة حول التاريخ الطبيعي لفئران المنزل.

على الرغم من أن الفئران المنزلية قد خضعت للدراسة لأكثر من قرن من الزمان ، لا تزال هناك أسئلة مهمة حول البيولوجيا الأساسية لفئران المنزل البرية التي لا تزال دون إجابة إلى حد كبير. ستزيد الإجابات على هذه الأسئلة قوة الماوس كنموذج للبحث.

ما هي طبيعة ومدى التباين في علم التشكل وعلم وظائف الأعضاء والتكاثر والتطور بين فئران البيوت البرية التي تكيفت لتعيش في بيئات مختلفة؟ على الرغم من أنه من المعروف أن فئران المنزل تحدث في مجموعة متنوعة من البيئات ، إلا أننا ما زلنا نعرف القليل نسبيًا عن بيئتها الفسيولوجية. على سبيل المثال ، كيف تنجو بعض الفئران المنزلية من البرودة الشديدة أو المرتفعات العالية أو المناطق شديدة الجفاف؟ من المرجح أن توفر الدراسة الإضافية لمثل هذه المجموعات نماذج فأر إضافية للأنماط الظاهرية المهمة.

ما هي محددات البنية الاجتماعية في الفئران؟ تعيش الفئران أحيانًا في مناطق صغيرة وأحيانًا تعيش في تجمعات أكبر ، ولكن لا يزال هناك الكثير مما يجب تعلمه حول أسباب هذه الاختلافات.

ما هي مسببات الأمراض والطفيليات الموجودة في الفئران المنزلية من مناطق مختلفة؟ يمكن أن تكون العوامل المعدية قوة تطورية قوية ، لكننا لا نعرف سوى القليل عن العدوى الطبيعية للفئران من أماكن مختلفة. من المحتمل أن تتنوع مسببات الأمراض بين المناطق المعتدلة والاستوائية ، ولكن هذا لا يزال إلى حد كبير غير محقق. وبالمثل ، قد تكون الفئران من مناطق مختلفة قد طورت مقاومة لمسببات الأمراض المختلفة ، ولكن هذا أيضًا لم يتم دراسته في الغالب.

ما الذي يحدد حدود توزيع الفئران المنزلية؟ لقد نجحوا بشكل مذهل في استعمار مناطق جديدة ، لكنهم غير موجودين في كل مكان. ما مدى أهمية المنافسة مع القوارض المحلية في تحديد توزيع الفئران المنزلية؟

ما الجينات التي يقوم عليها التكيف؟ لا يزال فهمنا للأساس الجيني للاختلافات التكيفية في مهده. كانت هناك بعض عمليات مسح الجينوم للاختيار ، لكن حالات قليلة تم فيها ربط جينات معينة بأنماط ظاهرية معينة.

ما هو هيكل كتل النمط الفرداني في مجموعات الفئران البرية الطبيعية؟ يعد فهم بنية النمط الفرداني أمرًا مهمًا لتوصيف وفهم تطور إعادة التركيب ، كما أنه سيضع الأساس لدراسات الارتباط باستخدام الفئران البرية.


شاهد الفيديو: العبث بالموروث الجيني للإنسان. إلى أين وصلت قضية التوأم الصيني المعدل (كانون الثاني 2022).