Bio-informatica

Een weblog met onderwerpen over bio-informatica, allemaal goed en wel, maar wat is bio-informatica nu feitelijk? Daarom deze pagina, die verre van volledig is, maar aangevuld wordt als dat nodig is.

Definitie

Een algemeen geaccepteerde defintie is er niet, maar het komt vooral neer op het volgende: bio-informatica is het toepassen van informatica op biologische data om daarmee tot nieuwe inzichten te komen. Het is dus géén informatica, net zo min als biologie. Dat wordt nogal snel vergeten.

Vaak gebruikt in één adem is “systeembiologie”, we zien het organisme als een systeem en proberen dat systeem te vatten en het uit te buiten.

Het is niet echt een discipline op zich, maar bundelt kennis uit en genereert kennis voor biologie, geneeskunde, biotechnologie en informatica/statistiek.

De informatica

De bio-informaticus gebruikt zijn computer. Wat hij daar dan mee doet, kan heel uiteenlopend zijn. De meest gehoorde term daarbij is allicht datamining. Datamining is een techniek uit de artificiële intelligentie waarbij het er op neerkomt om structuren, patronen, informatie te halen uit gegevens. Het maakt daarbij gebruik van wiskunde (berekeningen, algoritmes) en statistiek (kansberekeningen, hypothesetesten), maar dan wel geautomatiseerd. Ook informatica dus.

De biologie

De biologie verschaft de informatie waar mee gewerkt wordt. Biologische gegevens kunnen van allerlei oorsprong zijn. Vaak gaat het over DNA en eiwitten. Die bestaan uit welbepaalde chemische componenten (respectievelijk nucleotiden en aminozuren) die dan weer voor bepaalde kenmerken zorgen. Vaak gaat het over de sequenties (de opeenvolging van de componenten, samen vormen die een soort zin van componenten) en de structuur van die biologische moleculen.

De data kunnen ook van andere oorsprong zijn. Ook andere chemische componenten kunnen van belang zijn, bijvoorbeeld in de zin van “past molecule A in een bepaald eiwit?”, een belangrijke vraag als we medicijnen willen ontwikkelen. Want jawel, medicijnen ontwerpen is ook een mogelijkheid voor bio-informatica. Er zijn al programma’s die voor ons passende moleculen maken die bijvoorbeeld de werking van een eiwit in ons lichaam kunnen blokkeren of net activeren.

Veel data zitten opgeslagen in databanken. Die data komen vaak van laboratoriumonderzoek. De informatica kan ons dan helpen bepaalde concepten uit die databank te veralgemenen (= statistiek, machinaal leren) en te gebruiken op nieuwe gegevens in de toekomst. Zo kunnen we DNA-sequenties vergelijken en er stambomen mee opstellen. Of verwante genen zoeken die wel instaan voor andere processen in ons lichaam. De mogelijkheden gaan best ver: we kunnen er verschillen in populaties van bijvoorbeeld dieren mee bepalen, of we maken van de data gebruik om te weten welke koeien we uit onze kudde gaan nemen om mee te kweken omdat ze een bepaald gen al dan niet hebben. Het is dan belangrijk goede programma’s te hebben om dat te verwezenlijken.

De data kan ook heel numeriek zijn. Bijvoorbeeld om een idee te geven over de hoeveelheid van een zeker eiwit in een lichaamscel, vergeleken met die van een andere cel, maar dan voor heel veel eiwitten. Het is dan een kwestie van te vinden welke eiwitten voorkomen bij andere. Dan kunnen we ook zoeken of de genen voor die eiwitten (eiwitten zijn het indirecte product van genen, die zelf uit DNA bestaan) ‘verwant’ zijn. Dat betekent dan dat ze bijvoorbeeld in elkaars buurt liggen en dan ook makkelijker samen voor hun product instaan. Misschien passen ze ook wel in elkaar en vormen ze zo één geheel. Het is dan mogelijk heel complexe netwerken tussen al die eiwitten en genen te maken en op te slaan in databanken.

En het laboratorium?

Dat is eigenlijk het vernieuwende aan de bio-informatica: geen laboratorium vereist, alleen een pc, bij voorkeur aangesloten op een server met een behoorlijke rekenkracht. Laboratoriumonderzoek is heel duur. Met een computer kun je jaren doen. Bovendien kun je het nog voor zoveel meer gebruiken. Het gaat ook nog eens veel sneller in heel wat gevallen. En wiskundig exacter.

Naar analogie met onderzoek in vivo (in het organisme zelf) en in vitro (in glas, dus in reageerbuizen, tegenwoordig ook in meer gangbare kunststoffen, en dus niet in het organisme zelf) is de term “in silico” bedacht: onderzoek op computers, genoemd naar het hoofdbestanddeel van alle apparatuur anno begin 21ste eeuw: silicium.

Veel onderzoek binnen de biologie zou in silico kunnen en is dan ook wenselijk. Onderzoek in labs is vaak gevaarlijk, niet al te nauwkeurig, duur, het vereist vaak proefdieren… Computers kunnen veel exacter en statistisch juist al wat berekenen waar je in het lab misschien pas na veel trial and error op zou komen. Met de nieuwste technieken vind je zelfs informatie waar je als mens nooit op zou komen. Het lab blijft weliswaar een noodzakelijke schakel in het hele gebeuren. Computeronderzoek steunt op kennis uit laboratoriumonderzoek van vroeger en nieuwe bevindingen moeten ook nog steeds getest worden in de praktijk, in het lab dus. De rol van het lab verkleint wel, maar op zich is dat een goede zaak. Bio-informatica staat op zich apart van het laboratoriumgebeuren, maar de gevonden concepten moeten er toch vaak nog gescreend worden. Dat is belangrijk om de juistheid van het concept te bewijzen.

Conclusie

Bio-informatica is een heel handig instrument om biologisch onderzoek mee uit te voeren. We kunnen er relaties en functies van genen en eiwitten mee vinden, maar we kunnen ook van de opgedane kennis gebruik maken om er nieuwe te maken. Het biedt mogelijkheden binnen de biologie en bij uitbreiding in landbouw en geneeskunde (wat veruit het belangrijkste is in de praktijk). De geleerde technieken kunnen ook vaak gebruikt worden in andere domeinen, zoals informatica en statistiek.

Zeg wat je te zeggen hebt