Neural Network Approaches To Survival Analysis

University dissertation from Department of Astronomy and Theoretical Physics, Lund University

Abstract: Popular Abstract in Swedish Denna avhandling behandlar artificiella neuron nätverk och deras applikation inom medicin. Den utgår ifrån att det är viktigt att kunna uppskatta en patients överlevnadschanser för att kunna erbjuda rätt behandling för olika former av cancer. Generellt kan man säga att ju värre prognos desto mer omfattande behandling behöver man sätta in. Vissa patienter kan botas med enbart kirurgi eller strålbehandling medan andra även kräver tilläggsbehandling så som cytostatika (cellgifter). Eftersom behandlingen kan vara påfrestande är det givetvis ett mål att inte överbehandla patienter. I vissa fall har man endast tillräckligt med resurser för att erbjuda en viss andel av patienterna den mer omfattande behandlingen. I båda fallen finns det ett stort behov av att tillförlitligt kunna uppskatta en patients prognos. Det finns en uppsjö av olika faktorer som påverkar överlevnad och eventuell risk. Till exempel ökar många gånger koncentrationen av PSA (äggviteämne som produceras i prostatans körtelceller) i blodet vid prostatacancer och höga halter av östrogen och progesteron (två hormoner) kan ge ökad risk för bröstcancer. Att blodprov skulle uppvisa förhöjda nivåer av PSA eller östrogen är dock långt ifrån ett entydigt bevis på förekomsten av cancer. Bättre prediktion är möjlig om man även tar hänsyn till andra faktorer så som ålder eller genetik, men det blir snabbt ohanterligt att kombinera fler än ett fåtal faktorer, speciellt om man måste göra det med hänsyn till tusentals patienter. I överlevnadsanalys försöker man lösa detta hjälp av statistiska modeller som kan kombinera ett teoretiskt sätt obegränsat antal faktorer. Ett sätt att skapa statistiska modeller är genom att använda sig av maskininlärning, även kallat artificiell intelligens i vissa sammanhang. Maskininlärning tillåter en dator att på egen hand lära sig att identifiera mönster och samband. Det är med hjälp av maskininlärning som en dator kan tyda dina röstkommandon, posten kan sortera dina vykort och du kan söka efter bilder hos Google. I avhandlingen ligger fokus på en speciell metod inom maskininlärning kallad artificiella neuron nätverk (ANN) och på hur man kan träna dessa nätverk för applikationer inom överlevnadsanalys. Ett ANN är en förenklad modell av vår egen hjärna. Denna består av ett komplext nätverk av miljarder nervceller kallade neuroner. I jämförelse består ett ANN oftast av ett tiotal men ibland upp till flera tusen neuroner. Trots den högst begränsade kapaciteten jämfört med en mänsklig hjärna är ANN väldigt kapabla att lära sig att hitta mönster i data. En annan maskininlärningsteknik som är inspirerad av naturen är genetiska algoritmer. En genetisk algoritm är en simulering av naturlig evolution där en population av modeller tillåts para sig och generera nya modeller som är korsningar av sina "föräldrar". Precis som i naturen förekommer det också slumpmässiga mutationer som introducerar förändringar i avkommans "gener". Genom att låta strukturen hos ANN representera generna kan datorn automatiskt utveckla egna modeller. Konventionella träningsalgoritmer för ANN kräver ofta att den felfunktion (ett mått på hur mycket fel modellen gör vid prediktion av till exempel överlevnad) man försöker minimera kan deriveras, vilket för prognostiska tillämpningar ofta innebär en begränsning. Kombinationen av genetiska algoritmer och ANN gör det möjligt att bygga prognostiska modeller på ett mer direkt sätt än vad som annars hade varit möjligt. Detta eftersom en genetisk algoritm kan minimera vilken felfunktion som helst.

  CLICK HERE TO DOWNLOAD THE WHOLE DISSERTATION. (in PDF format)