معلومة

إنزيمات التقييد ، كيف يتم تحديد تسلسل التعرف؟


كيف كانت تسلسل التعرف (على سبيل المثالGAATTCمن EcoRI ،GGATCCمن بامهي) تتميز؟ تسرد الكتب النصية مواقع التعرف فقط ولكنها لا تسرد المنهجيات المستخدمة لتحديد التسلسلات.


تصف هذه الورقة طريقة بسيطة لتحديد مواقع التقييد ، والتي تم استخدامها لتحديد تسلسل التقييد للإنزيم غير المعهود سابقًا من المستدمية الغالينية.

باختصار ، تسلسل معروف من الحمض النووي (من الملتهمة $ phi text {X174} $) يتم هضمه جزئيًا باستخدام إنزيم التقييد ، ويمكن استخدام الأجزاء المختلفة المهضومة لتحديد المسافات النسبية بين كل موقع من مواقع التقييد.

بعد ذلك ، يتم تمديد أجزاء التقييد باستخدام بوليميراز T4 وتسلسلها باستخدام $ ^ {32} text {P} $ المسمى Sanger.

بمجرد اكتمال خريطة تقييد الإنزيم في تسلسل الحمض النووي المعروف ، يمكن بعد ذلك فحص الأجزاء الفردية بحثًا عن أوجه التشابه. على سبيل المثال، Hgaلدي موقع تعرّف خارج موقع التقييد. لذلك ، عند مقارنة مواقع التقييد الفردية ، يمكن ملاحظة أن جميعها لديها موقع التعرفGACGC.


أساسيات إنزيم التقييد

أين يمكن أن تكون أبحاث البيولوجيا الجزيئية الحديثة بدون إنزيمات مقيدة؟ كانت هذه القوى العاملة في المختبر وراء العديد من التطورات في الأبحاث البيولوجية الأساسية والتطبيقات التجارية لأكثر من 40 عامًا. تم تحديد إنزيمات التقييد (أو نوكليازات تقييدية) لأول مرة في البكتيريا ولكن تم العثور عليها لاحقًا في بعض العتائق. بشكل عام ، تشق الإنزيمات المقيدة الحمض النووي مزدوج الشريطة. يتعرف كل إنزيم تقييد تسلسل DNA معين ، ويمكن أن يحدث الانقسام ضمن تسلسل التعرف أو بعيدًا بعض الشيء ، اعتمادًا على الإنزيم. يتراوح طول تسلسل التعرف بشكل عام من 4 إلى 8 أزواج أساسية (bp) ، ويمكن أن ينتج الانقسام نهايات لزجة (5 ′ أو 3 نهايات بارزة) أو نهايات غير حادة (شكل 1).

الشكل 1. نهايات لزجة أو بارزة (5 أو 3) أو نهايات غير حادة تنتجها إنزيمات تقييدية محددة.

اليوم تم تمييز حوالي 4000 إنزيم مقيد ، وأكثر من 600 منها متوفر تجارياً. REBASE هو مورد مفيد وقابل للتصفح للحصول على معلومات شاملة ومحدثة حول إنزيمات التقييد ، بما في ذلك الخصوصية والحساسية والمصادر التجارية [1].

على هذه الصفحة:


النوع الأول من إنزيمات التقييد وأقاربهم

إنزيمات التقييد من النوع الأول (REases) عبارة عن بروتينات خماسية كبيرة ذات تقييد منفصل (R) وميثيل (M) ووحدات فرعية للتعرف على تسلسل الحمض النووي (S). لقد كانوا أول REases تم اكتشافها وتنقيتها ، ولكن على عكس النوع الثاني REases المفيد للغاية ، لم يجدوا بعد مكانًا في صندوق الأدوات الأنزيمية لعلماء الأحياء الجزيئية. كان من الصعب توصيف إنزيمات النوع الأول ، لكن هذا يتغير حيث يكشف تحليل الجينوم عن جيناتها ، ويكشف تحليل الميثيلوم عن تسلسل التعرف عليها. تمت دراسة العديد من REases من النوع I بالتفصيل وما تم تعلمه عنها يستدعي مزيدًا من الاهتمام. في هذه المقالة ، نناقش جوانب الكيمياء الحيوية والبيولوجيا وتنظيم النوع الأول REases ، والآليات التي طورتها العاثيات والبلازميدات للتهرب منها. تتمتع REases من النوع الأول بقدرة رائعة على تغيير خصوصية التسلسل عن طريق خلط المجال وإعادة الترتيب. نلخص التجارب والملاحظات الكلاسيكية التي أدت إلى هذا الاكتشاف ، ونناقش كيف تعتمد هذه القدرة على التنظيمات المعيارية للإنزيمات ووحداتها الفرعية S. أخيرًا ، نصف أمثلة لأنظمة تعديل التقييد من النوع الثاني التي لها ميزات مشتركة مع إنزيمات النوع الأول ، مع التركيز على إنزيمات النوع IIG المتنوعة.

الأرقام

نموذج M.EcoKI MTase ...

نموذج لملف M.EcoKI MTase (ملف pdb 2Y7H). تتكون الوحدة الفرعية S ...

المكونات التحفيزية من النوع الأول ...

المكونات التحفيزية لأنزيمات النوع الأول آر إم. الشكل العلوي ، على اليسار: الوحدة الفرعية R / T ...

مثبطات البروتين من النوع الأول ...

مثبطات البروتين لأنزيمات النوع الأول آر إم. اللوحة العلوية: نموذج DNA (ذرات الهيدروجين ...

هيكل الوحدة الفرعية من النوع I S (pdb: 1YF2). تسلسل التعرف على هذا ...

حلزونات Dimerization من النوع الأول ...

حلزونات Dimerization للوحدات الفرعية من النوع I S. الرسم التخطيطي العلوي: محاذاة تسلسل أأ من ...

منظمات MTases المعدلة لفئة جاما. ...

منظمات MTases المعدلة لفئة جاما. γ-MTases تحفز نقل مجموعة الميثيل من ...


العمل مع إنزيمات التقييد

توجد حزمة إنزيم التقييد في Bio.Restriction. ستسمح لك هذه الحزمة بالعمل مع إنزيمات التقييد وتحقيق تحليل التقييد على التسلسل الخاص بك. القيود الاستفادة من التسهيلات التي تقدمها إعادة ويحتوي على فئات لأكثر من 800 إنزيم مقيد. سيقودك هذا الفصل إلى نظرة عامة سريعة على التسهيلات التي توفرها حزمة التقييد الخاصة بـ Biopython. تم إنشاء الفصل كجلسة Python تفاعلية وأفضل طريقة لقراءته هي فتح غلاف Python بجانبك.

1.1 استيراد الانزيمات

لاستيراد الإنزيمات ، افتح غلاف بايثون واكتب:

ستلاحظ بالتأكيد أن الحزمة بطيئة جدًا في التحميل. هذا أمر طبيعي لأن كل إنزيم له فئته الخاصة وهناك الكثير منهم. لن يؤثر ذلك على سرعة Python بعد الاستيراد الأولي.

لا أعرف من أجلك ولكني أجد أنه من المرهق للغاية أن تضطر إلى بدء كل عملية بالقيود. ، فهذه طريقة أخرى لاستيراد الحزمة.

ومع ذلك ، فإن لهذه الطريقة عيبًا كبيرًا: يكاد يكون من المستحيل استخدام الأمر dir () بعد الآن نظرًا لوجود الكثير من الإنزيمات التي يصعب قراءتها. يتم توفير حل بديل في نهاية هذا البرنامج التعليمي. أترك لك تحديد الطريقة التي تفضلها. لكن في هذا البرنامج التعليمي سأستخدم الثاني. إذا كنت تفضل الطريقة الأولى ، فستحتاج إلى بدء كل مكالمة بإنزيم التقييد مع التقييد. في ما تبقى من البرنامج التعليمي.

1.2 اصطلاح التسمية

للوصول إلى الإنزيم ببساطة أدخل اسمه. يجب أن تحترم اصطلاح التسمية المعتاد بالأحرف الكبيرة والترقيم اللاتيني (بالأحرف الكبيرة أيضًا):

ecori أو EcoR1 ليسا إنزيمات ، EcoRI و KpnI هما.

1.3 البحث عن المواقع المحظورة

إذن ماذا يمكننا أن نفعل بهذه الإنزيمات المقيدة؟ لنرى أننا سنحتاج إلى تسلسل DNA. تدعم إنزيمات التقييد كلاً من كائنات Bio.Seq.MutableSeq و Bio.Seq.Seq. يمكنك استخدام أي أبجدية DNA تتوافق مع أبجدية IUPAC.

البحث عن تسلسل لوجود موقع تقييد للإنزيم المفضل لديك هو أمر بسيط مثل:

النتائج عبارة عن قائمة. القائمة هنا فارغة لأنه من الواضح أنه لا يوجد موقع EcoRI في my_seq. دعنا نحاول الحصول على تسلسل مع موقع EcoRI.

لذلك لدينا موقع في الموضع 16 من التسلسل اكوزك. الموضع الذي تم إرجاعه بواسطة طريقة البحث هو القاعدة الأولى للمقطع السفلي الناتج عن قيد (أي القاعدة الأولى بعد الموضع الذي سيقطع فيه الإنزيم). تتبع حزمة التقييد التقاليد البيولوجية (القاعدة الأولى للتسلسل هي القاعدة 1). لا داعي لإجراء تحويلات صعبة بين بياناتك البيولوجية المسجلة والنتائج التي تنتجها الإنزيمات في هذه الحزمة.

1.4 استرجاع التسلسلات الناتجة عن عملية الهضم

كائنات التسلسل مثل جميع متواليات Python ، لها اصطلاحات مختلفة والقاعدة الأولى للتسلسل هي القاعدة 0. لذلك للحصول على التسلسلات التي تنتجها عملية الهضم EcoRI لـ اكوزك، يجب على المرء أن يفعل ما يلي:

أسمعك تفكر وهذا طريقة مرهقة وعرضة للخطأ للحصول على هذه التسلسلات & quot. لتبسيط حياتك ، يوفر لك خيار التقييد طريقة أخرى للحصول على هذه التسلسلات دون متاعب: التحفيز. ستعيد هذه الطريقة مجموعة تحتوي على جميع الأجزاء الناتجة عن الهضم الكامل للتسلسل. استخدامه بسيط كما كان من قبل:

راجع للشغل ، يمكنك أيضًا استخدام تهجئتها بالطريقة الأمريكية لتحفيز:

1.5 تحليل المتواليات الدائرية

الآن ، إذا أدخلت الأمر السابق في قوقعتك ، فربما تكون قد لاحظت أن كلاً من البحث والتحفيز يمكن أن يأخذ وسيطة ثانية خطية والتي تكون افتراضية على True. سيسمح لك استخدام هذا بمحاكاة التسلسلات الدائرية مثل البلازميدات. يؤدي الإعداد الخطي إلى False إلى إعلام الإنزيم بإجراء البحث عبر تسلسل دائري والبحث عن المواقع المحتملة الممتدة عبر حدود التسلسل.

حسنًا ، هذا اختلاف كبير ، فنحن نحصل على جزء واحد فقط يتوافق مع التسلسل الخطي. تم تغيير تسلسل البداية لأخذ هذه الحقيقة في الاعتبار. علاوة على ذلك ، يمكننا أن نرى اختلافًا آخر:

كما ترى باستخدام خطي = خطأ ، اجعل موقعًا يظهر في التسلسل new_seq. هذا الموقع غير موجود في تسلسل خطي حيث يتم تقسيم موقع EcoRI إلى نصفين في بداية ونهاية التسلسل. ومع ذلك ، في تسلسل دائري ، يكون الموقع موجودًا بشكل فعال عندما يتم ضم بداية التسلسل ونهايته.

1.6 مقارنة الإنزيمات مع بعضها البعض

تحدد إنزيمات التقييد 4 عوامل مقارنة == و! = و & gt & gt و٪. كل هذه العوامل تقارن بين إنزيمين معًا وتعود إما True أو False.

== (اختبار الهوية) سيعود صحيح إذا كان وجهي المشغل متماثلين. * يتم تعريف نفس & quot على أنه: نفس الاسم ، ونفس الموقع ، ونفس العبء (أي الشيء الوحيد الذي يساوي EcoRI هو EcoRI). ! = (اختبار لموقع مختلف أو قطع) سيعود صحيح إذا كان جانبي المشغل مختلفين. لا يختلف إنزيمان إذا كانت النتيجة التي ينتجها إنزيم واحد ستكون دائمًا نفس النتيجة التي ينتجها الآخر (على سبيل المثال ، لن تكون isoschizomers الحقيقية هي نفس الإنزيمات ، فهي ليست مختلفة لأنها قابلة للتبديل). & gt & gt (test for neoschizomer) صحيح إذا كانت الإنزيمات تتعرف على نفس الموقع ، لكنها تقطعها بطريقة مختلفة (أي أن الإنزيمات عبارة عن نيوسيزومرات). ٪ (اختبار التوافق) اختبر توافق النهاية التي تنتجها الإنزيمات (سيكون ذلك صحيحًا إذا كانت الأجزاء المنتجة بأحد الإنزيم يمكن ربطها مباشرة بأجزاء ينتجها الآخر).

دعنا نستخدم Acc65I و isoschizomers كمثال:

1.7 التسهيلات الأخرى التي تقدمها فئات الإنزيم

توفر فئة التقييد عددًا كبيرًا من الطرق الأخرى. لن نتناولها جميعًا ، ولكن سنلقي نظرة سريعة على أكثرها فائدة.

لا تمتلك كل الإنزيمات نفس الخصائص عندما يتعلق الأمر بالطريقة التي تهضم بها الحمض النووي. إذا كنت تريد معرفة المزيد عن طريقة قطع إنزيم معين ، يمكنك استخدام الطرق الثلاث التالية. إنها سهلة إلى حد ما لفهم والإشارة إلى النهايات التي ينتجها الإنزيم: غير حادة ، 5 'متدلية (تسمى أيضًا 3' راحة) نهاية لزجة و 3 'متدلية (أو 5' راحة) نهاية لزجة.

يمكن إنتاج عرض أكثر تفصيلاً لموقع التقييد باستخدام طريقة elucidate (). يشير الرمز ^ إلى موضع القطع بمعنى الخيط المتسلسل ، _ إلى الخيط المضاد أو التكميلي. ^ _ تعني فظة.

سيعطيك تردد الطريقة () التردد الإحصائي لموقع الإنزيم.

للحصول على طول تسلسل التعرف على الإنزيم ، استخدم الوظيفة المضمنة len ():

ومن المثير للاهتمام أيضًا طرق التعامل مع المتشابهات المتماثلة. للذاكرة ، اثنان من الإنزيمات المتشيزومرات إذا كانا يشتركان في نفس موقع التعرف. يتم إجراء تقسيم إضافي بين المتشابهات المتشابهة (نفس الاسم ، والتعرف على نفس التسلسل والقطع بنفس الطريقة) و النيوسيزومرات التي تقطع في مواقع مختلفة. Equischizomer هو اختيار تعسفي لتصميم & quotisoschizomers_that_are_not_neoschizomers & quot لأن هذا الأخير كان طويلاً بعض الشيء. مجموعة أخرى من طريقة one_enzyme.is_ * schizomers (one_other_enzyme) ، تسمح باختبار إنزيمين ضد بعضهما البعض.

سيحصل الموردون () على قائمة بجميع موردي الإنزيم. ستوفر لك all_suppliers () جميع الموردين في قاعدة البيانات.

2. فئة RestrictionBatch: فئة للتعامل مع عدة إنزيمات

إذا كنت ترغب في عمل خريطة تقييد لتسلسل ، فإن استخدام الإنزيمات الفردية يمكن أن يصبح مملاً وسيتحمل عبئًا كبيرًا بسبب التحويل المتكرر للتسلسل إلى FormattedSeq (انظر الفصل 5). يوفر التقييد فئة لتسهيل استخدام عدد كبير من الإنزيمات دفعة واحدة: RestrictionBatch. ستساعدك RestrictionBatch على معالجة الكثير من الإنزيمات بأمر واحد. علاوة على ذلك ، ستشترك جميع الإنزيمات الموجودة في مجموعة التقييد في نفس التسلسل المحول ، مما يقلل من الحمل.

2.1 إنشاء مجموعة قيود

يمكنك بدء دفعة تقييد عن طريق تمرير قائمة من الإنزيمات أو أسماء الإنزيمات إليها كوسيطة.

من السهل إضافة إنزيم جديد إلى مجموعة التقييد:

هناك طريقة أخرى لإنشاء RestrictionBatch وهي ببساطة إضافة إنزيمات تقييدية معًا ، وهذا مفيد بشكل خاص للدفعات الصغيرة:

2.2 تقييد دفعة تقييد لمورد معين

تعتمد حزمة التقييد على إعادة قاعدة البيانات. توفر قاعدة البيانات هذه قائمة بالموردين لكل إنزيم. سيكون من العار عدم الاستفادة من هذه التسهيلات. يمكنك إنتاج مجموعة تقييدية تحتوي فقط على إنزيمات من مورد واحد أو عدة موردين. إليك كيفية القيام بذلك:

يأخذ موردو الحجة قائمة برمز واحد أو عدة رموز فردية تتوافق مع المورد (الموردين). الرموز هي نفسها كما هو محدد في REBASE. نظرًا لأنه سيكون من الصعب تذكر كل رمز مورد ، فإن RestrictionBatch توفر طريقة توضح رمز الزوج & lt = & gt المورد:

يمكن لهذه الطريقة لإنتاج RestrictionBatch أن تقلل بشكل كبير من كمية المخرجات غير المجدية من تحليل القيود ، مما يقصر البحث على الإنزيمات التي يمكنك الحصول عليها ويحد من مخاطر الانهيار العصبي. ليس هناك ما هو أكثر إحباطًا من الحصول على الإنزيم المثالي لاستنساخ فرعي فقط لتجد أنه غير متوفر تجاريًا.

2.3 إضافة الإنزيمات إلى مجموعة القيود

إن إضافة إنزيم إلى دفعة إذا كان الإنزيم موجودًا بالفعل لن يثير استثناءً ، ولكن لن يكون له أي تأثير. في بعض الأحيان تريد الحصول على إنزيم من RestrictionBatch أو إضافته إلى المجموعة إذا لم يكن موجودًا. ستستخدم طريقة get لتعيين الوسيطة الثانية إضافة إلى True.

2.4 إزالة الإنزيمات من دفعة التقييد

تتم إزالة الإنزيمات من دفعة باستخدام طريقة الإزالة (). إذا لم يكن الإنزيم موجودًا في الدفعة ، فسيؤدي ذلك إلى حدوث خطأ في المفتاح. إذا لم تكن القيمة التي تريد إزالتها إنزيمًا ، فسيؤدي ذلك إلى زيادة خطأ القيمة.

2.5 التلاعب في RestrictionBatch

ومع ذلك ، لا يمكنك إضافة مجموعات معًا ، حيث إنها مجموعات Python. يجب عليك استخدام عامل تشغيل الأنابيب | في حين أن. يمكنك العثور على التقاطع بين دفعتين باستخدام & amp (راجع وثائق Python حول المجموعات لمزيد من المعلومات.

2.6 تحليل المتواليات مع RestrictionBatch

لتحليل تسلسل لموقع محتمل ، يمكنك استخدام طريقة البحث للدفعة ، بنفس الطريقة التي استخدمتها مع إنزيمات التقييد. النتائج لم تعد قائمة ولكن معجم. مفاتيح القاموس هي أسماء الإنزيمات والقيمة قائمة موقع الموضع. لا تطبق RestrictionBatch طريقة التحفيز ، حيث لن يكون لها معنى حقيقي عند استخدامها مع دفعة كبيرة.

2.7 طرق RestrictionBatch الأخرى

من بين الطرق الأخرى التي توفرها RestrictionBatch ، فإن العناصر () التي تعيد قائمة بجميع أسماء العناصر مرتبة أبجديًا ، هي بالتأكيد الأكثر فائدة.

إذا كنت لا تهتم بالترتيب الأبجدي ، فاستخدم الطريقة as_string () ، للحصول على نفس الشيء بشكل أسرع قليلاً. لم يتم فرز القائمة. الترتيب عشوائي لأن مجموعات بايثون هي قاموس.

تُستخدم طرق RestrictionBatch الأخرى عمومًا لأغراض معينة ولن تتم مناقشتها هنا. انظر المصدر إذا كنت مهتما.

3. AllEnzymes و CommOnly: اثنان من دفعات التقييد سابقة التكوين

في حين أنه من العملي في بعض الأحيان إنتاج مجموعة تقييد خاصة بك ، فمن المؤكد أنك ستستخدم الدُفعتين المتوفرتين مع حزم التقييد: AllEnzymes و CommOnly. تحتوي هاتان الدفعتان على التوالي على جميع الإنزيمات الموجودة في قاعدة البيانات وفقط الإنزيمات التي لديها مورد تجاري. إنها كبيرة نوعًا ما ، لكن هذا ما يجعلها مفيدة. باستخدام هذه الدُفعة ، يمكنك إنتاج وصف كامل للتسلسل باستخدام أمر واحد. يمكنك استخدام هاتين الدُفعة كأي دفعة أخرى.

لا يوجد الكثير ليقال عنهم بصرف النظر عن حقيقة أنهم موجودون. إنها دفعات عادية حقًا ، ويمكنك استخدامها كأي دفعة أخرى.

4. فئة التحليل: تحليل أبسط للقيود

يمكن أن يوفر لك RestrictionBatch قاموسًا يحتوي على مواقع لجميع الإنزيمات دفعة واحدة. ومع ذلك ، من الجيد أحيانًا الحصول على شيء أسهل في القراءة من قاموس Python. ليس من السهل تحليل القيود المعقدة باستخدام RestrictionBatch. ستساعد بعض التحسينات في طريقة البحث في تسلسل لمواقع التقييد. يوفر التحليل سلسلة أوامر لتخصيص النتائج التي تم الحصول عليها من دفعة / تسلسل تقييد الزوج وبعض التسهيلات لجعل الإخراج أكثر قابلية للقراءة من قبل الإنسان.

4.1 إعداد تحليل

لبناء تحليل التقييد ، ستحتاج إلى RestrictionBatch وتسلسل وإخباره ما إذا كان التسلسل خطيًا أم دائريًا. الوسيطة الأولى التي يأخذها التحليل هي دفعة التقييد ، والثانية هي التسلسل. إذا لم يتم توفير الوسيطة الثالثة ، فسيفترض التحليل أن التسلسل خطي.

4.2 تحليل القيود الكامل

بمجرد إنشاء تحليلك الجديد ، يمكنك استخدامه للحصول على تحليل تقييد تسلسلك. طريقة إجراء تحليل قيود كامل للتسلسل هي:

هذا يشبه إلى حد كبير إخراج أسلوب RestrictionBatch.search. ستحصل على إخراج أسهل للقراءة باستخدام print_that الذي يستخدم بدون وسيطة:

أكثر وضوحا ، أليس كذلك؟ تم تحسين الإخراج لصدفة بعرض 80 عمودًا. إذا كان الإخراج يبدو غريبًا ، فتحقق من أن عرض غلافك يبلغ 80 عمودًا على الأقل.

4.3 تغيير العنوان

يمكنك توفير عنوان للتحليل وتعديل الجملة "الإنزيمات التي لا تقطع التسلسل" ، عن طريق تعيين الوسيطتين الاختياريين print_that ، العنوان و s1. لن يتم إجراء أي تنسيق على هذه السلاسل ، لذا إذا كان عليك تضمين السطر الجديد ( n) كما تراه مناسبًا:

4.4 تخصيص الإخراج

يمكنك تعديل بعض جوانب المخرجات بشكل تفاعلي. هناك ثلاثة أنواع رئيسية من المخرجات ، نوعان من القوائم (مرتبة أبجديًا ومصنفة حسب عدد الموقع) ونوع يشبه الخريطة. لتغيير الإخراج ، استخدم طريقة print_as () للتحليل. يكون تغيير الإخراج دائمًا بالنسبة لمثيل التحليل (أي حتى المرة التالية التي تستخدم فيها print_as ()). وسيطة print_as () هي سلاسل: "map" أو "number" أو "alpha". كما رأيت سابقًا ، فإن السلوك الافتراضي هو قائمة أبجدية ("ألفا").

للعودة إلى السلوك السابق:

4.5 تحليل قيود مربي الحيوانات

لن أخوض في التفاصيل لكل طريقة مفردة ، فإليك جميع الوظائف المتاحة. معظمها تشرح نفسها تمامًا والآخر موثق جيدًا إلى حد ما (استخدم help ('Analysis.command_name')). الطرق هي:

استخدام هذه الطرق بسيط:

للحصول على مخرجات جيدة ، ما زلت تستخدم print_that ولكن هذه المرة مع الأمر الذي تريد تنفيذه كوسيطة.

4.6 تحليل أكثر تعقيدًا

يمكن تزويد كل هذه الطرق (باستثناء () الكاملة والتي ، حسنًا ، تقوم بتحليل كامل للقيود) بقاموس إضافي. إذا لم يتم توفير قاموس ، فسيتم استخدام تحليل القيود الكامل كنقطة بداية. وإلا فسيتم استخدام القاموس الذي توفره الوسيطة dct. يجب تنسيق القاموس كنتيجة RestrictionBatch.search. لذلك من الشكل <'enzyme_name': [position1، position2]. > ، أين الموضع 1 و الموضع 2 هي أعداد صحيحة. كل الطرق تسرد المخرجات السابقة مثل هذه القواميس ويمكن استخدامها كنقطة بداية.

باستخدام هذه الطريقة ، يمكنك إنشاء استعلام معقد حقًا عن طريق تسلسل عدة طرق واحدة تلو الأخرى. على سبيل المثال ، إذا كنت تريد جميع الإنزيمات التي يبلغ حجمها 5 بوصات وتقطع التسلسل مرة واحدة فقط ، فلديك طريقتان للذهاب:

تتمثل الطريقة الصعبة في إنشاء دفعة تقييد تحتوي على 5 إنزيمات متراكمة فقط واستخدام هذه الدُفعة لإنشاء مثيل تحليل جديد ثم استخدام الطريقة مع_N_sites () على النحو التالي:

الحل السهل هو ربط عدة طرق تحليل. هذا ممكن لأن كل طريقة تُرجع القاموس كنتائج وتكون قادرة على أخذ قاموس كمدخل:

القاموس هو دائمًا الوسيطة الأخيرة مهما كان الأمر الذي تستخدمه.

تعتمد طريقة التفضيل بالتأكيد على الشروط التي ستستخدم فيها مثيل التحليل الخاص بك. إذا كان من المحتمل أن تعيد استخدام نفس الدُفعة بشكل متكرر بتسلسلات مختلفة ، فقد يكون استخدام RestrictionBatch مخصص أسرع حيث من المحتمل أن تكون الدُفعة أصغر. تكون طرق التسلسل أسرع بشكل عام عند العمل مع غلاف تفاعلي. في البرنامج النصي ، قد يكون فهم البنية الموسعة أسهل في غضون بضعة أشهر.

5. الميزات المتقدمة: فئة FormattedSeq

تتطلب إنزيمات التقييد تنسيقًا أكثر صرامة لتسلسلات الحمض النووي أكثر مما يوفره كائن Bio.Seq. على سبيل المثال ، تتوقع إنزيمات التقييد العثور على تسلسل أحرف كبير غير مفصول (بدون مسافة) ، بينما يسمح كائن Bio.Seq بالتسلسلات في الأحرف الصغيرة مفصولة بمسافات. لذلك عندما يقوم إنزيم تقييد بتحليل كائن Bio.Seq (سواء كان Seq أو MutableSeq) ، يخضع الكائن لعملية تحويل. تضمن فئة FormattedSeq التحويل السلس من كائن Bio.Seq إلى شيء يمكن أن يستخدمه الإنزيم بأمان.

بينما يتم إجراء هذا التحويل تلقائيًا بواسطة الإنزيمات إذا قمت بتزويدهم بـ Seq أو MutableSeq ، فهناك وقت يكون فيه أكثر كفاءة لتحقيق التحويل قبل اليد. في كل مرة يتم فيها تمرير كائن Seq إلى إنزيم لتحليله ، تدفع تكاليف إضافية بسبب التحويل. عند تحليل نفس التسلسل مرارًا وتكرارًا ، سيكون من الأسرع تحويل التسلسل وتخزين التحويل ثم استخدام التسلسل المحول فقط.

5.1 إنشاء مساحة منسقة

يعد إنشاء FormattedSeq من كائن Bio.Seq أمرًا بسيطًا. الوسيطة الأولى لـ FormattedSeq هي التسلسل الذي ترغب في تحويله. يمكنك تحديد شكل باستخدام الوسيطة الثانية الخطية ، إذا لم تقم بذلك فسيكون FormattedSeq خطيًا:

5.2 بخلاف Bio.Seq ، يحتفظ FormattedSeq بمعلومات حول شكلها

يحتفظ FormattedSeq بمعلومات حول شكل التسلسل. لذلك ، بخلاف Seq و MutableSeq ، لا تحتاج إلى تحديد شكل التسلسل عند استخدام البحث () أو التحفيز ():

في الواقع ، لا يتم تغيير شكل FormattedSeq بواسطة الوسيطة الثانية للبحث عن الأوامر () وتحفيز ():

5.3 تغيير شكل FormattedSeq

ومع ذلك ، يمكنك تغيير شكل FormattedSeq. الأمر الذي يجب استخدامه هو:

5.4 استخدام / و // عوامل التشغيل مع FormattedSeq

يمنحك عدم الاضطرار إلى تحديد شكل التسلسل لتحليله الفرصة لاستخدام الاختصار "/" و "//" مع إنزيمات التقييد:

هناك طريقة أخرى لتجنب الحمل الزائد بسبب التحويل المتكرر من كائن Seq إلى FormattedSeq وهي استخدام RestrictionBatch.

في الختام ، فإن مكاسب الأداء التي يتم تحقيقها عند استخدام FormattedSeq بدلاً من Seq ليست ضخمة. يعد تحليل تسلسل 10 كيلو بايت بواسطة جميع الإنزيمات في AllEnzymes (بالنسبة إلى x في AllEnzymes: x.search (seq) ، 867 إنزيمًا) أسرع بنسبة 7٪ عند استخدام FormattedSeq من Seq. يعد استخدام RestrictionBatch (AllEnzymes.search (seq)) بنفس سرعة استخدام FormattedSeq في المرة الأولى التي يتم فيها تشغيل البحث. ومع ذلك ، يتم تقليل هذا بشكل كبير في عمليات التشغيل اللاحقة بنفس التسلسل (يحتفظ RestrictionBatch في الذاكرة بنتيجة آخر تشغيل بينما لم يتم تغيير التسلسل).

6. المزيد من الميزات المتقدمة

يتناول هذا الفصل بعض الميزات المتقدمة للحزم ، ويمكن لمعظم المستخدمين تجاهلها بأمان.

6.1 تحديث الإنزيمات من REBASE

بالتأكيد لن يحتاج معظم الناس إلى تحديث الإنزيمات. سيتم تحديث حزمة إنزيم التقييد مع كل إصدار جديد من Biopython. ولكن إذا كنت ترغب في الحصول على تحديث بين إصدارات Biopython ، فإليك كيفية القيام بذلك.

أولاً ، يجب عليك تنزيل البرنامجين rebase_update.py و ranacompile.py: انتقل إلى https://github.com/biopython/biopython/tree/master/Scripts/Restriction ، وانقر فوق الملف المعني واضغط على 'خام"الموجود في الجزء العلوي الأيمن من نافذة التعليمات البرمجية. ثم ، بالنقر بزر الماوس الأيمن ، احفظ الملف. يجب أن يكون كلا البرنامجين في نفس الدليل.

6.1.1 جلب ملفات الإنزيم الحديثة يدويًا من REBASE

كل شهر ، تطلق REBASE مجموعة جديدة من البيانات حول إنزيمات التقييد. في حين أن الإنزيمات لا تتغير كثيرًا ، قد ترغب في تحديث فئات إنزيمات التقييد. أول شيء يجب فعله هو الحصول على آخر ملف rebase. يمكنك العثور على إصدار REBASE على http://rebase.neb.com/rebase/rebase.files.html. الملف الذي تهتم به موجود بتنسيق EMBOSS. يمكنك تنزيل الملفات مباشرة من خادم REBASE ftp باستخدام متصفحك. الملف موجود في ftp://ftp.neb.com/pub/rebase. سيتعين عليك تنزيل 3 ملفات: emboss_e. ### ، emboss_r. ### ، و emboss_s. ###. ### هو رقم مكون من 3 أرقام يتوافق مع سنة وشهر الإصدار. الرقم الأول هو العام ، والآخران هما الشهر: لذلك سيكون يوليو 2015: 507 أكتوبر 2016: 610 ، وما إلى ذلك. قم بتنزيل الملفات الثلاثة المقابلة للشهر الحالي وضعها في نفس المجلد مثل rebase_update.py و ranacompiler.py البرامج النصية.

6.1.2 جلب ملفات الإنزيم الحديثة باستخدام rebase_update.py

هناك طريقة أخرى لفعل الشيء نفسه وهي استخدام البرنامج النصي rebase_update.py. سيتم الاتصال مباشرة بخادم ftp rebase وتنزيل آخر دفعة من ملفات الزخرفة. من قذيفة DOS أو Unix ، قم بما يلي:

هناك حاجة إلى بعض الشرح: -p هو مفتاح التبديل للإشارة إلى البرنامج النصي الذي تستخدمه وكيلاً. إذا كنت تستخدم وكيل بروتوكول نقل الملفات ، أدخل عنوانه ومنفذ الاتصال بعد ":".

6.1.3 تجميع قاموس جديد باستخدام ranacompiler.py

بمجرد حصولك على ملفات الزخرفة الحديثة ، يمكنك تجميع وحدة نمطية جديدة تحتوي على البيانات اللازمة لإنشاء إنزيم التقييد.

ملاحظة: إذا لم تكن ملفات الزخرفة موجودة في الدليل الحالي أو إذا لم تكن محدثة ، فسوف يستدعي ranacompiler.py البرنامج النصي rebase_update.py ، والذي يجب تثبيته في نفس المجلد. سوف تحتاج إلى استخدام نفس الخيارات كما كان من قبل (ie -m و -p). راجع الفقرة السابقة على rebase_update.py لمزيد من التفاصيل.

من أجل التبسيط ، لنفترض أننا وضعنا ملفات الزخرفة في نفس المجلد مثل الملفات التي تحتوي على البرنامج النصي ranacompiler.py. قد يكون لديك تغيير في وضع الملف لجعله قابلاً للتنفيذ:

عادة ما تحصل على الرسالة التالية:

يشير السطر الأول إلى ملفات الزخرفة التي تم استخدامها في التجميع الحالي. يمكنك تجاهل التحذيرات بأمان طالما أن تجميع القاموس الجديد: حسنًا. موجود في الجزء الأخير من الإخراج. هم هنا لغرض التصحيح. يشار إلى عدد الإنزيمات في الوحدة الجديدة بالإضافة إلى قائمة القاموس التي تم تجميعها. يشير الجزء الأخير إلى أنه تم إنشاء الوحدة بنجاح ولكن لم يتم تثبيتها. لإنهاء التحديث ، يجب عليك نسخ الملف Restriction_Dictionary.py في المجلد / your_python_path / site -pack / Bio / Restriction / كما هو موضح في البرنامج النصي. بالنظر إلى المجلد الحالي ، سترى الملفات الجديدة: القاموس الذي تم إنشاؤه حديثًا Restriction_Dictionary.py و Restriction_Dictionary.old. يحتوي هذا الملف الأخير على القاموس القديم الذي يمكنك الرجوع إليه في حالة تلف أي شيء في الملف الجديد (لا ينبغي أن يحدث هذا نظرًا لأن البرنامج النصي سعيد بما فيه الكفاية فالقاموس الجديد جيد ، ولكن إذا كانت هناك مشكلة فمن الجيد دائمًا معرفتك يمكن العودة إلى الإعداد السابق دون الحاجة إلى إعادة تثبيت كل شيء.

إذا كنت ترغب في ذلك ، فقد يقوم البرنامج النصي بتثبيت المجلد لك أيضًا ، ولكن سيتعين عليك تشغيله كجذر إذا لم يكن لدى المستخدم العادي حق الوصول للكتابة إلى تثبيت Python الخاص بك (ويجب ألا يكون). استخدم الأمر ranacompiler.py -i أو ranacompiler.py - التثبيت لهذا الغرض.

إذا حدث خطأ ما (ليس لديك حق الوصول للكتابة إلى المجلد الوجهة على سبيل المثال) ، فسيخبرك البرنامج النصي بأنه لم يقم بإجراء التثبيت. ومع ذلك فإنه سيظل يحفظ الوحدة الجديدة في الدليل الحالي.

كما ترى ، فإن النص ليس ساطعًا للغاية وسيعيد التجميع في كل مرة يتم استدعاؤه ، بغض النظر عما إذا كان هناك إصدار سابق من الوحدة موجود بالفعل.

6.2 التصنيف الفرعي لفئة التحليل

كما رأينا سابقًا ، يمكنك تعديل بعض جوانب مخرجات التحليل بشكل تفاعلي. ومع ذلك ، إذا كنت ترغب في كتابة فئة التحليل الخاصة بك ، فقد ترغب في توفير تسهيلات إخراج أخرى أكثر مما هو مذكور في هذه الحزمة. اعتمادًا على ما تريد القيام به ، قد تفلت من تغيير طريقة make_format للفصل المشتق أو ستحتاج إلى توفير طرق جديدة. بدلاً من الدخول في شرح طويل ، إليك تطبيق فئة تحليل غير مجدية إلى حد ما:

باستخدام هذا المثال ، كقالب ، يجب أن تكون قادرًا الآن على تحليل الفئة الفرعية كما يحلو لك. ستجد المزيد من تفاصيل التنفيذ في الوحدة النمطية Bio.Restriction.PrintFormat التي تحتوي على الفئة التي توفر جميع أساليب _make_ *.

7. التحديد والتحذير

على وجه الخصوص ، يعد تحليل الفصل تنفيذًا سريعًا وقذرًا يعتمد على التسهيلات التي توفرها الحزمة. يرجى التحقق من النتائج الخاصة بك والإبلاغ عن أي خطأ.

على أساس أكثر عمومية ، للقيود بعض القيود الأخرى:

7.1 جميع الحمض النووي غير مميثل

لم يتم تنفيذ أي مرفق للعمل مع الحمض النووي الميثلي حتى الآن. بقدر ما يتعلق الأمر بفئات الإنزيم ، فإن كل الحمض النووي هو DNA غير ميثلي. من المحتمل أن يتم تنفيذ حساسية المثيلة في المستقبل. ولكن في الوقت الحالي ، إذا تم ميثلة التسلسل الخاص بك ، فسيتعين عليك التحقق مما إذا كان الموقع ميثليًا باستخدام وسائل أخرى.

7.2 لا يوجد دعم لنشاط النجوم

كما كان من قبل ، لم يتم تنفيذ أي دعم حتى الآن للعثور على موقع تم التعرف عليه بشكل خاطئ من قبل الإنزيمات تحت ظروف تركيز الملح العالي ، ما يسمى نشاط النجم. سيتم تنفيذ هذا بمجرد أن أحصل على مصدر جيد للمعلومات لذلك.

7.3 آمنة للاستخدام مع الحمض النووي المنحل

من الآمن استخدام الحمض النووي المنحل كمدخل للاستعلام. لن تغمر نفسك بنتائج لا معنى لها. لكن هذا يأتي بسعر: GAAنلن يتم التعرف على TC كموقع EcoRI محتمل على سبيل المثال ، في الواقع لن يتم التعرف عليه على الإطلاق. لن يتم تحليل التسلسلات المنحلة. إذا لم يكن التسلسل الخاص بك متسلسلًا بالكامل ، فستفقد بالتأكيد مواقع التقييد:

7.4 القواعد غير القياسية في الحمض النووي غير مسموح بها

بينما يمكنك استخدام الحمض النووي المنحل ، فإن استخدام الأبجدية الأساسية غير القياسية سيجعل الإنزيمات تختنق ، حتى لو قبلتها Bio.Seq.Seq. ومع ذلك ، ستتم إزالة الأحرف التي تشبه الفراغ ("،" ، "" ،.) والرقم ولكنها لن توقف الإنزيم عن تحليل التسلسل. يمكنك استخدامها ولكن الأجزاء الناتجة عن التحفيز ستفقد أي تنسيق. يحاول التحفيز الاحتفاظ بالحالة الأصلية للتسلسل (على سبيل المثال ، ستؤدي التسلسلات الصغيرة إلى أجزاء صغيرة ، وتسلسل الأحرف الكبيرة شظايا الأحرف الكبيرة) ، ولكن الحالة المختلطة ستعيد الأجزاء الكبيرة:

قد يبدو عدم السماح بأحرف أخرى غير IUPAC جذريًا ولكن هذا في الواقع للحد من الأخطاء. إنه ليس دليلًا خادعًا تمامًا ولكنه يساعد.

7.5 المواقع الموجودة على حافة الحمض النووي الخطي قد لا يمكن الوصول إليها في عملية الهضم الحقيقية

بينما لن يتم الإبلاغ عن المواقع الخارجية للتسلسل ، لم يتم فعل أي شيء لمحاولة تحديد ما إذا كان موقع التقييد في نهاية التسلسل الخطي صالحًا:

EcoRI finds a site at position 2 even if it is highly unlikely that EcoRI accepts to cut this site in a tube. It is generally considered that at about 5 nucleotides must separate the site from the edge of the sequence to be reasonably sure the enzyme will work correctly. This "security margin" is variable from one enzyme to the other. In doubt consult the documentation for the enzyme.

7.6 Restriction reports cutting sites not enzyme recognition sites

Some enzymes will cut twice each time they encounter a restriction site. The enzymes in this package report both cut not the site. Other software may only reports restriction sites. Therefore the output given for some enzymes might seems to be the double when compared with the results of these software. It is not a bug.

8. Annex: modifying dir() to use with from Bio.Restriction import *

Having all the enzymes imported directly in the shell is useful when working in an interactive shell (even if it is not recommended by the purists). Here is a little hack to get some sanity back when using dir() in those conditions:


أنزيمات التقييد

أصبح المجال المزدهر للتكنولوجيا الحيوية ممكنًا من خلال اكتشاف إنزيمات التقييد في أوائل الخمسينيات من القرن الماضي. معهم ، يمكن قطع الحمض النووي في مواقع محددة. يمكن بعد ذلك استخدام إنزيم ثانٍ - DNA ligase - لإعادة تجميع القطع بأي ترتيب مرغوب فيه. يسمح هذان الإنزيمان معًا للباحثين بتجميع جينومات مخصصة. على سبيل المثال ، يمكن للباحثين إنشاء بكتيريا مُصممة تصنع الأنسولين أو هرمون النمو أو تضيف جينات مقاومة للأمراض للنباتات الزراعية.

خاصية مثيرة للاهتمام لأنزيمات التقييد تبسط هذا القطع الجزيئي واللصق. تتعرف إنزيمات التقييد عادةً على تسلسل متماثل للحمض النووي ، مثل موقع EcoRI الموضح في الشكل. لاحظ أن الخصلة العلوية هي نفسها الخصلة السفلية ، اقرأ بالعكس. عندما يقطع الإنزيم الشريط بين G و A ، فإنه يترك سلاسل متدلية. تسمى هذه "النهايات اللاصقة" لأن أزواج القاعدة المتكونة بين الجزأين المتدليتين سوف تلصق القطعتين معًا ، على الرغم من قطع العمود الفقري. تعتبر النهايات اللاصقة جزءًا أساسيًا من الهندسة الوراثية ، مما يسمح للباحثين بقطع أجزاء صغيرة من الحمض النووي ووضعها في أماكن محددة ، حيث تتطابق الأطراف اللاصقة.

استكشاف الهيكل

يحتوي PDB على هياكل للعديد من إنزيمات التقييد. مثال آخر من Escherichia coli - EcoRV - موضح هنا. يُظهر الهيكل الموجود في الأعلى ، المأخوذ من إدخال PDB 1rva ، الإنزيم المرتبط بقطعة قصيرة من الحمض النووي. يوضح السهم مجموعة الفوسفات التي سيتم قطعها. يوضح الرسم التوضيحي السفلي ، المأخوذ من إدخال PDB 1rvc ، الهيكل بعد قطع الحمض النووي. تم إدخال جزيء ماء ، لذلك توجد الآن ذرتان من الأكسجين ، قريبتان من بعضهما البعض ولكن غير مترابطتين معًا ، حيث كانت هناك ذرة أكسجين واحدة مرتبطة في الحمض النووي السليم.

في كلا الرسمين التوضيحيين ، يظهر البروتين بتمثيل بسيط للعمود الفقري وشريط DNA واحد ملون باللون الأخضر. تم إنشاء هذه الرسوم التوضيحية باستخدام RasMol. يمكنك إنشاء رسوم توضيحية مماثلة من خلال النقر على رموز انضمام PDB أعلاه واختيار أحد خيارات العرض ثلاثي الأبعاد.


Arber, W. & Linn, S. A. Rev. Biochem. 38, 467–500 (1969).

Bullas, L. R., Colson, C. & Van Pel, A. J. gen. ميكروبيول. 95, 166–172 (1976).

Fuller-Pace, F. V., Bullas, L. R., Delius, H. & Murray, N. E. بروك. natn. أكاد. علوم. الولايات المتحدة الأمريكية. 81, 6095–6099 (1984).

Nagaraja, V., Shepherd, J. C. W., Pripfl, T. & Bickle, T. A. J. جزيء. بيول. 182, 579–587 (1985).

Sanger, F., Coulson, A. R., Hong, G. F., Hill, D. F. & Petersen, G. B. J. جزيء. بيول. 162, 729–773 (1982).

Bajwa, W., Meyhack, B., Rudolph, H., Schweingruber, A. M. & Hinnen, A. الدقة الأحماض النووية. 12, 7721–7739 (1984).

Sengstag, C. & Arber, W. EMBO J. 2, 67–71 (1983).

Chan, P. T., Ohmori, H., Tomizawa, J.-I. & Lebowitz, J. J. biol Chem. (في الصحافة).

Dunn, J. J. & Studier, F. W. J. جزيء. بيول. 166, 477–535 (1983).

Sadler, I., Suda, K., Schatz, G., Kaudewitz, F. & Haid, A. EMBO J. 3, 2137–2143 (1984).

Bickle, T. A. in The Nucleuses (eds Linn, S. & Roberts, R. J.) 85–108 (Cold Spring Harbor Laboratory, New York, 1982).

Cough, J. A. & Murray, N. E. J. جزيء. بيول. 166, 1–19 (1983).

Arber, W. & Kühnlein, U. طريق. ميكروبيول. 30, 946–952 (1967).

Krüger, D. H. & Bickle, T. A. ميكروبيول. القس. 47, 345–360 (1983).


BspT104I (AsuII, NspV) restriction enzyme

يرجى الاطلاع على شهادة تحليل المنتج للحصول على معلومات حول ظروف التخزين ومكونات المنتج والمواصفات الفنية. يرجى الاطلاع على قائمة مكونات المجموعة لتحديد مكونات المجموعة. توجد شهادات التحليل وقوائم مكونات الأدوات ضمن علامة التبويب "المستندات".

Takara Bio USA، Inc.
الولايات المتحدة / كندا: +1.800.662.2566 & bull Asia Pacific: +1.650.919.7300 & Bull Europe: +33. (0) 1.3904.6880 & bull Japan: +81. (0) 77.565.6999
لأغراض البحث فقط. ليس للاستخدام في إجراءات التشخيص. & نسخ 2021 Takara Bio Inc. جميع الحقوق محفوظة. جميع العلامات التجارية مملوكة لشركة Takara Bio Inc. أو الشركات التابعة لها في الولايات المتحدة و / أو البلدان الأخرى أو أصحابها المعنيين. قد لا يتم تسجيل بعض العلامات التجارية في جميع الولايات القضائية. يتوفر المنتج الإضافي والملكية الفكرية ومعلومات الاستخدام المقيد على takarabio.com.

Takara Bio Europe عضو في Takara Bio Group ، وهي شركة رائدة في علوم الحياة ملتزمة بتحسين حالة الإنسان من خلال التكنولوجيا الحيوية. من خلال علاماتنا التجارية Takara و Clontech و Cellartis ، تتمثل مهمتنا في تطوير أدوات وخدمات مبتكرة عالية الجودة لتسريع الاكتشاف.


Restriction enzymes, how are the recognition sequences determined? - مادة الاحياء

Restriction enzymes have obscure sounding names which are directly derived from the bacterial strains from which they were first isolated. Most of the restriction enzymes we purchase commercially have been cloned and are now isolated from engineered E. coli expressing them - they still bear their original names however. Several examples of how these enzymes are named are shown below.

Restriction enzymes are classified on the basis of two fundamental properties.
First, whether the enzyme cuts at its recognition site, and second whether the restriction and modification activities are associated with the same or different complexes.

Restriction endonucleases recognize specific sequences 4 to 8 base pairs long. These restriction sites are typically pallindromic - they read identically on both strands.

While each restriction enzyme recognizes and cleaves a specific sequence, a given recognition sequence may be recognized by multiple enzymes. Enyzmes which recognize the same sequence are called isoschizomers. Recently these have been further divided into two classes - isoschizomers and neoschizomers - which cleave the DNA at the same position or different positions respectively.

Frequency of Restriction Enzyme Sites

The frequency with which restriction sites occur in a random sequence can be simply calculated if the GC content of the random sequence is known. For each nucleotide position in the restriction site, determine the frequency with which that position is occupied by the appropriate base. Then multiply the frequencies together to obtain the frequency with which the complete site is observed.

4-mer sequence will occur
1/4 x 1/4 x 1/4 x 1/4
= 1/256 bp

6-mer sequence will occur
1/4 x 1/4 x 1/4 x 1/4 x 1/4 x 1/4
= 1/4096 bp

8-mer sequence will occur
1/4 x 1/4 x 1/4 x 1/4 x 1/4 x 1/4 x 1/4 x 1/4
= 1/65536 bp

2/10 x 3/10 x 3/10 x 2/10
= 1/278 bp

Similarly the 6-mer would cut

2/10 x 2/10 x 3/10 x 3/10 x 2/10 x 2/10
= 1/6944 bp

2/10 x 2/10 x 2/10 x 2/10 x 2/10 x 2/10 x 2/10 x 2/10
= 1/390625 bp

Average fragment size and average frequency of restriction enzyme cutting depends on both the length and the GC bias of the recognition site as well as the GC bias of the genome being cut.


Explain briefly (a) PCR (ب) تقييد الإنزيمات والحمض النووي (c) Chitinase

(a) PCR: - Polymerase chain reaction (PCR) is a technique in molecular biology to amplify a gene or a piece of DNA to obtain its several copies. It is extensively used in the process of gene manipulation. The process involves في المختبر synthesis of sequences using a primer, a template strand, and a thermostable DNA polymerase enzyme obtained from a bacterium, called ثيرموس أكواتيكوس. The enzyme utilizes building blocks dNTPs (deoxynucleotides) to extend the primer. In the first step, the double stranded DNA molecules are heated to a high temperature so that the two strands separate into a single stranded DNA molecule. This process is called denaturation. Then, this ssDNA molecule is used as a template strand for the synthesis of a new strand by the DNA polymerase enzyme and this process is called annealing, which results in the duplication of the original DNA molecule. This process is repeated over several cycles to obtain multiple copies of the rDNA fragment.

(ب) Restriction enzymes are molecular scissors used in molecular biology for cutting DNA sequences from a specific site. It plays an important role in gene manipulation. The enzymes recognize a specific six-box pair sequence known as the recognition sequence and cut the sequence at a specific site. For example, the recognition site for enzyme ECORI is as follows:

Restriction enzyme are categorized into two types &minus

(i) Exonuclease &minus It is a type of restriction enzyme that removes the nucleotide from either 5 &rsquo or 3 &rsquo ends of the DNA molecule.

(ii) Endonuclease &minus It is a type of restriction enzyme that makes a cut within the DNA at a specific site. This enzyme acts as an important tool in genetic engineering. It is commonly used to make a cut in the sequence to obtain DNA fragments with sticky ends, which are later joined by enzyme DNA ligase.

(c) Chitinase &minus Chitinase is a class of enzymes used for the degradation of chitin, which forms a major component of the fungal cell wall. Therefore, to isolate the DNA enclosed within the cell membrane of the fungus, enzyme chitinase is used to break the cell for releasing its genetic material.


شاهد الفيديو: Restriction Enzymes - Class 12 (كانون الثاني 2022).