Preskoči na sadržaj

Format za unos formula molekula SMILES

Pojednostavljeni sustav unosa linija s molekularnim ulazom ili kraće SMILES (engl. Simplified Molecular Input Line Entry System) omogućava lako čitljiv i jednostavan zapis molekula pomoću niza znakova. U nastavku ćemo razmotriti nekoliko osnovnih sintaktičkih pravila koji se moraju poštovati.

Poznate spojeve, ali i vlastite nove spojeve, moguće je crtati na platnu koristeći mrežne alate:

Zadatak

  1. Koristeći PubChem mrežni alat za crtanje molekula, nacrtajte sljedeći kemijski spoj koji je prikazan na slici:

    aspirin

    Izvor slike: PubChem CID 2244

  2. Za automatski generirani SMILES zapis prethodnog crteža, pronađite naziv, kemijsku formulu i 3D prikaz molekule u bazi PubChem.

Atomi i veze

SMILES podržava sve elemente u periodnom sustavu. Svaki se atom označava svojim kemijskim simbolom u uglatim zagradama, na primjer [Au] za zlato. Zagrade se mogu izostaviti za organski dio molekule i to za elemente B,C, N, O, P, S, F, Cl, Br i I. Svi drugi elementi moraju biti u zagradama. Ako su zagrade izostavljene, pretpostavlja se da se radi o regularnom broju atoma vodika. Naprimjer, za vodu je jednostavno O jer se podrazumjeva da su na kisik spojena 2 atoma vodika iako nije greška napisati [OH2] ili [H]O[H]

Veze su predstavljene pomoću jednog od sljedećih simbola prikazanih u tablici:

Simbol Opis veze Primjer
. Nepovezane strukture Natrijev klorid [Na+].[Cl-]
- Jednostruka veza Etan C-C
= Dvostruka veza Ugljikov dioksidO=C=O
# Trostruka veza Cijanovodična kiselina C#N
/ Prikaz jednostrukih veza uz dvostruku vezu 1,2-difluoretilen F/C=C/F

Iako se pojedinačne veze mogu zapisati s oznakom -, to se obično izostavlja. Na primjer, etanol može biti napisan kao C-C-O, CC-O ili C-CO, ali obično se piše CCO.

Kombiniranjem simbola atoma i simbola veza možemo prikazati jednostavne lančane strukture pomoću SMILES notacije. Važno je napomenuti da strukture koje se unose pomoću SMILES-a ne uključuju vodikove atome. SMILES softver automatski prepoznaje broj mogućih veza koje svaki atom može imati. Ako korisnik ne specificira dovoljno veza putem SMILES notacije, sustav će automatski pretpostaviti da su preostale veze zadovoljene vodikovim vezama.

Zadatak

Koristeći PubChem, mrežni alat za crtanje molekula, nacrtajte sljedeće spojeve pomoću formata SMILES: metan, etan, propan i butan. Prokomentirajte dobivene rezultate.

Grane

Grane se označavaju zagradama, kao što je prikazano u primjeru CCC(=O)O za propionsku kiselinu i FC(F)F za fluoroform. Prvi atom unutar zagrada i prvi atom nakon zagrada su povezani na isti atom. Simbol veze mora biti unutar zagrada, na primjer izraz izvan zagrada poput CCC=(O)O nije valjan.

Zadatak

Koristeći PubChem nacrtajte sljedeće spojeve pomoću formata SMILES: izopropanol, aceton, izopentan i 2,2-dimetilbutan.

Ioni

Ako je atom u ioniziranom stanju može se dodati znak + ili -, na primjer hidroksid je [OH-], amonij [NH4+], a [Ti+4] ili [Ti++++] je titanij.

Zadatak

Koristeći PubChem nacrtajte sljedeće spojeve pomoću formata SMILES: hidronij i kobalt(III).

Prstenaste strukture

Prstenaste strukture možemo kreirati korištenjem brojeva za identifikaciju otvaranja i zatvaranja atoma prstena. Na primjer, u C1CCCCC1, prvi ugljik ima broj 1 koji se povezuje jednostrukom vezom s posljednjim ugljikom koji također ima broj 1. Dobivena struktura predstavlja cikloheksan. Spojevi koje imaju višestruke prstenove mogu se identificirati korištenjem različitih brojeva za svaki prsten.

Zadatak

Koristeći PubChem nacrtajte sljedeće spojeve pomoću formata SMILES: ciklooktan i benzen.

Author: Matea Turalija