مواصفات الإدخال النصي المبسط للجزيئات

توليد سماليز

مواصفات الإدخال النصي المبسط للجزيئات أو سمايلز بالإنگليزية: Simplified molecular input line entry specification or SMILES: هي توصيف لا لبس فيه لبنية الجزيئات الكيميائية باستخدام سلسلة أسكي قصيرة.

يمكن لأي برنامج محرر للجزيئات أن يستورد نص سمايلز لتحويلها مرة ثانية إلى رسم ثنائي الأبعاد أو نموذج ثلاثي الأبعاد للجزيء. إن توصيف سمايلز الأول طوره آرثر وايننگر و ديڤيد وايننگر في أواخر 1980. ومنذ ذلك الحين تم تعديل التوصيف وتوسيعه من قبل الآخرين، وأبرزها شركة دايلايت لنظم المعلومات الكيميائية (Daylight Chemical Information Systems Inc.). وفي عام 2007، قامت جماعة الكيميائيين للمصادر المفتوحة بلو أوبليسك (Blue Obelisk) بتطوير معيار مفتوح (open standard) سمي OpenSMILES. وقد تضمنت الترميزات الخطية الأخرى على ترميز فايسفيسسير الخطي (Wiswesser Line Notation (WLN))، و(ROSDAL)، و (SLN) (شركة تريبوس).

في أغسطس 2006، قدم الاتحاد الدولي للكيمياء البحتة والتطبيقية IUPAC ما يسمى محدد الهوية الكيمائية العالمي (InChI) وهو بمثابة معيار لتمثيل الصيغة. تعتبر سمايلز عمومًا أنها قابلة للقراءة من البشر أكثر من محدد الهوية الكيمائية العالمي (InChI) ؛ كما أنها تمتلك قاعدة واسعة من البرامج الدعمة ذات الدعم النظري الواسع (على سبيل المثال، نظرية المخططات).

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

المصطلحات

يشير مصطلح سماليز إلى كيفية ترميز نصي عن طريق تشفير التركيب الجزيئي. ويشار لها حصرًا باسم سلسلة سمايلز. ولكن مصطلح سمايلز يستخدم أيضًا للإشارة إلى كلا من سلسلة سمايلز المفردة و عدد من سلاسل السمايلز، والمعنى الدقيق عادة ما يبدو من السياق. المصطلحات قانوني و متماكب قد تؤدي إلى بعض الخلط عندما تطبق في كتابة السمايلز. فالمصطلح يصف خصائص مختلفة لسلسلة السمايلز ولا يستبعد بعضها بعضا.

يمكن كتابة عدة سلاسل سمايلز متكافئة لنفس الجزيء. فعلى سبيل المثال، CCO، OCC، C(O)C جميعها توصف التركيب الجزيئي للإيثانول. طورت خوارزميات لضمان توليد نفس السمايلز لنفس الجزيء بغض النظر عن ترتيب الذرات في التركيب الجزيئي. سلسلة السمايلز هذه وحيدة لكل تركيب جزيئي، وإن كان يعتمد على استخدام خوارزمية قانونية (canonicalisation) لهذا الغرض، ويطلق عليها سمايلز القانونية. تحول هذه الخوارزميات السمايلز أولا إلى تمثيل داخلي للبنية الجزيئية ولا تتلاعب بالسلسلة كما يعتقد في بعض الأحيان. طورت الخوارزميات التي تولد سمايلز القانونية في شركة دايلايت لنظم المعلومات الكيميائية (Daylight Chemical Information Systems)، و شركة أوبن آي للبرامج العلمية (OpenEye Scientific Software)، ومجموعة الحساب الكيميائي (Chemical Computing Group).

يسمح ترميز السمايلز بتوصيف التكوين الفراغي في مراكز رباعي السطوح، وهندسة الروابط المضاعفة. هذه هي السمات البنيوية التي لا يمكن توصيفها بسهولة، تسمى السمايلز التي توصفها بـ سمايلز المتماكبة. ومن السمات البارزة لهذه القواعد هي أنها تسمح بتحديد دقيق جزئي للتماكب الضوئي. ويطلق مصطلح سمايلز المتماكب على السمايلز التي تحدد وتوصف النظائر.


المراجع

  • Anderson, E.; Veith, G.D; Weininger, D. (1987) SMILES: A line notation and computerized interpreter for chemical structures. Report No. EPA/600/M-87/021. U.S. EPA, Environmental Research Laboratory-Duluth, Duluth, MN 55804
  • Weininger, D. (1988), SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules, J. Chem. Inf. Comput. Sci. 28, 31-36.
  • Weininger, D.; Weininger, A.; Weininger, J.L. (1989) SMILES. 2. Algorithm for generation of unique SMILES notation J. Chem. Inf. Comput. Sci. 29, 97-101.
  • Helson, H.E. (1999) Structure Diagram Generation In Rev. Comput. Chem. edited by Lipkowitz, K. B. and Boyd, D. B. Wiley-VCH, New York, pages 313-398.

وصلات خارجية

توصيف السمايلز

برامج السمايلز