Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Deep Learning für die Biowissenschaften: Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse
Deep Learning für die Biowissenschaften: Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse
Deep Learning für die Biowissenschaften: Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse
eBook452 Seiten3 Stunden

Deep Learning für die Biowissenschaften: Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Deep Learning hat bereits in vielen Bereichen bemerkenswerte Ergebnisse erzielt. Jetzt hält es Einzug in die Wissenschaften, insbesondere in die Biowissenschaften. Dieses praxisorientierte Buch bietet Programmierern und Wissenschaftlern einen Überblick darüber, wie Deep Learning in Genomik, Chemie, Biophysik, Mikroskopie, medizinischer Analyse und der Arzneimittelforschung eingesetzt wird.
Das Buch vermittelt Deep-Learning-Grundlagen und führt in die Arbeit mit der Python-Bibliothek DeepChem ein. Sie erfahren, wie Deep Learning z.B. zur Analyse von Mikroskopaufnahmen, für molekulare Daten und bei medizinischen Scans genutzt wird. Abschließend zeigen Bharath Ramsundar und seine Co-Autoren anhand einer Fallstudie Techniken für die Entwicklung neuer Therapeutika, eine der größten interdisziplinären Herausforderungen der Wissenschaft.

- Lernen Sie, wie Machine Learning auf molekulare Daten angewendet werden kann
- Erfahren Sie, warum Deep Learning ein mächtiges Werkzeug für Genetik und Genomik ist
- Setzen Sie Deep Learning ein, um biophysikalische Systeme zu verstehen
- Erhalten Sie eine kurze Einführung in Machine Learning mit DeepChem
- Nutzen Sie Deep Learning zur Auswertung von Mikroskopaufnahmen
- Analysieren Sie medizinische Scans mithilfe von Deep-Learning-Techniken
- Erfahren Sie mehr über Variational Autoencoder (VAE) und Generative Adversarial Networks (GANs)
- Interpretieren Sie, was Ihr Modell tut und wie es funktioniert
"Ein wertvoller Beitrag für die wissenschaftliche Community."
– Prabhat
Teamleader Data and Analytics Services, NERSC, Lawrence Berkeley National Laboratory
"Ein hervorragender High-Level-Überblick, dersowohl Einstiegspunkte in bestimmte Techniken bietet als auch die Erörterung der zugrundeliegenden Wissenschaft."
– C. Titus Brown
Associate Professor, University of California, Davis
SpracheDeutsch
HerausgeberO'Reilly
Erscheinungsdatum25. Feb. 2020
ISBN9783960103516
Deep Learning für die Biowissenschaften: Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse

Ähnlich wie Deep Learning für die Biowissenschaften

Ähnliche E-Books

Wissenschaft & Mathematik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Deep Learning für die Biowissenschaften

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Deep Learning für die Biowissenschaften - Bharath Ramsundar

    KAPITEL 1

    Warum Biowissenschaften?

    Einsatzgebiete für all diejenigen mit technischem Verständnis und Leidenschaft für Daten gibt es viele, aber nur wenige Gebiete haben eine so grundlegende Auswirkung wie die biomedizinische Forschung. Der Beginn der modernen Medizin hat die Natur der menschlichen Existenz grundlegend verändert. In den letzten 20 Jahren wurden wir Zeuge, wie Innovationen das Leben unzähliger Menschen verändert haben. Bei ihrem ersten Auftreten im Jahr 1981 war HIV/Aids eine zumeist tödliche Krankheit. Die kontinuierliche Weiterentwicklung antiretroviraler Therapien hat die Lebenserwartung betroffener Patienten erheblich verlängert. Andere Krankheiten, wie zum Beispiel Hepatitis C, die vor einem Jahrzehnt noch als nicht behandelbar galt, können nun geheilt werden. Fortschritte in der Genetik ermöglichen die Identifikation und, hoffentlich bald, die Behandlung einer Vielzahl von Erkrankungen. Dank innovativer Diagnostik und Instrumentierung können Mediziner Krankheiten im menschlichen Körper spezifisch identifizieren und gezielt behandeln. Viele dieser Durchbrüche haben von rechnergestützten Methoden profitiert und werden durch diese weiter vorangetrieben.

    Warum Deep Learning?

    Algorithmen für Machine Learning sind inzwischen ein wichtiger Bestandteil des Alltags, vom Onlineshopping bis Social Media. Informatiker entwickeln Algorithmen, die es digitalen Assistenten wie Amazon Echo oder Google Home ermöglichen, Sprache zu verstehen. Fortschritte im Machine Learning haben die Übersetzung von Webseiten im laufenden Betrieb ermöglicht. Des Weiteren hat Machine Learning viele Bereiche der Physik und Biowissenschaften beeinflusst. Algorithmen werden auf alles angewandt, von der Entdeckung neuer Galaxien aus Teleskopaufnahmen bis zur Klassifizierung subatomarer Wechselwirkungen am Large Hadron Collider.

    Eine der Triebfedern dieser technologischen Fortschritte war die Entwicklung einer Klasse von Methoden des Machine Learning, die als Deep Neural Networks bekannt sind. Während die technologischen Voraussetzungen für künstliche neuronale Netze in den 1950er-Jahren entwickelt und in den 1980er-Jahren verfeinert wurden, entfaltete sich deren volles Potenzial erst in den letzten zehn Jahren mit der Weiterentwicklung der Computerhardware. Im nächsten Kapitel werden wir eine umfassendere Übersicht über Deep Neural Networks geben, es ist jedoch wichtig, die aus der Anwendung von Deep Learning entstandenen Fortschritte zu würdigen:

    Viele der Entwicklungen bei der Spracherkennung, die in Mobiltelefonen, Computern, Fernsehern und anderen mit dem Internet verbundenen Geräten allgegenwärtig sind, wurden durch Deep Learning vorangetrieben.

    Die Bilderkennung ist eine Schlüsselkomponente für selbstfahrende Autos, die Internetsuche und andere Anwendungen. Viele der Deep-Learning-Entwicklungen, die Anwendungen für Privatkunden vorangetrieben haben, werden jetzt in der biomedizinischen Forschung eingesetzt, zum Beispiel um Tumorzellen verschiedenen Typen zuzuordnen.

    Empfehlungssysteme sind zu einer Schlüsselkomponente des Onlineerlebnisses geworden. Unternehmen wie Amazon wenden Deep Learning an, um ihre Kunden, die ein bestimmtes Produkt gekauft haben, dazu zu bewegen, zusätzliche Einkäufe zu tätigen. Netflix geht ähnlich vor, um Filme vorzuschlagen, die ein Nutzer möglicherweise ebenfalls sehen möchte. Viele der Ideen, die hinter diesen Empfehlungssystemen stehen, werden verwendet, um neue Moleküle zu identifizieren, die als Ausgangspunkte für neue Wirkstoffentdeckungen dienen könnten.

    Übersetzungen waren einst die Domäne sehr komplexer statistischer Computerprogramme. In den letzten Jahren hat Deep Learning die Systeme, die jahrelang manuell kuratiert wurden, übertroffen. Viele der gleichen Ideen werden nun genutzt, um Konzepte aus der wissenschaftlichen Literatur zu extrahieren und Wissenschaftler auf Publikationen aufmerksam zu machen, die sie möglicherweise übersehen hätten.

    Die hier genannten sind nur einige der Innovationen, die durch die Anwendung von Deep-Learning-Methoden entstanden sind. Es ist eine interessante Zeit, in der sich allgemein verfügbare wissenschaftliche Daten und Methoden zu deren Verarbeitung annähern. Diejenigen, die in der Lage sind, Daten mit neuen Methoden zu kombinieren, um aus Mustern in diesen Daten zu lernen, können wichtige wissenschaftliche Fortschritte erzielen.

    In den modernen Biowissenschaften geht es um Daten

    Wie bereits erwähnt, hat sich die grundlegende Art der Biowissenschaften verändert. Die Verfügbarkeit von Robotik sowie miniaturisierte Experimente haben zu einem drastischen Anstieg der experimentellen Daten, die erstellt werden können, geführt. In den 1980er-Jahren führte ein Biologe ein einzelnes Experiment durch, das nur ein einzelnes Ergebnis lieferte. Dieses konnte dann meist manuell unter Zuhilfenahme eines Taschenrechners verarbeitet werden. Spulen wir zur heutigen Biologie vor, dann verfügen wir über Instrumente, die in ein oder zwei Tagen Millionen experimenteller Datenpunkte erzeugen können. Die Gensequenzierung beispielsweise, in der riesige Datensätze entstehen, ist kostengünstig und routinemäßig geworden.

    Die Fortschritte in der Gensequenzierung haben zur Entwicklung von Datenbanken geführt, die das genetische Erbgut einer Person mit einer Vielzahl von gesundheitlichen Auswirkungen, wie Diabetes, Krebs und genetisch bedingten Erkrankungen wie Mukoviszidose, verknüpfen. Mithilfe analytischer Methoden zur Analyse und Gewinnung dieser Daten entwickeln Wissenschaftler ein Verständnis für die Ursachen dieser Krankheiten und nutzen dieses, um neue Therapien zu entwickeln.

    Fachgebiete, die ehemals hauptsächlich auf menschlicher Beobachtung beruhten, verwenden nun Datensätze, die nicht länger manuell ausgewertet werden können. Heutzutage wird routinemäßig Machine Learning eingesetzt, um Bilder von Zellen zu klassifizieren. Die Ergebnisse dieser Machine-Learning-Modelle werden verwendet, um Krebstumore zu identifizieren und zu klassifizieren und die Auswirkung möglicher Krebstherapien zu bewerten.

    Fortschritte in experimentellen Techniken haben zum Aufbau mehrerer Datenbanken geführt, in denen die Strukturen von Chemikalien und die Auswirkungen dieser Chemikalien auf eine Vielzahl von biologischen Prozessen oder Aktivitäten katalogisiert werden. Diese Struktur-Aktivitäts-Beziehungen (SARs) bilden die Grundlagen eines Wissenschaftszweigs, der als Cheminformatik bezeichnet wird. Wissenschaftler nutzen diese umfangreichen Datensätze zum Erstellen von Vorhersagemodellen, die die nächste Generation der Arzneimittelentwicklung vorantreiben werden.

    Diese großen Datenmengen erfordern eine neue Generation von Wissenschaftlern, die sowohl in der Wissenschaft als auch der Informatik zu Hause sind. Diejenigen, die Kenntnisse aus beiden Bereichen besitzen, haben das Potenzial, Muster und Trends in großen Datensätzen aufzudecken und die wissenschaftlichen Entdeckungen von morgen zu sein.

    Was werden Sie lernen?

    In den ersten Kapiteln dieses Buchs geben wir einen Überblick über Deep Learning und wie es in den Biowissenschaften angewendet werden kann. Wir fangen mit Machine Learning an, das definiert wird als »die Wissenschaft (und Kunst), Rechner so zu programmieren, dass sie aus Daten lernen können«.¹

    Kapitel 2 enthält eine kurze Einführung in Deep Learning. Wir beginnen mit einem Beispiel, in dem gezeigt wird, wie diese Art des Machine Learning verwendet werden kann, um eine einfache Aufgabe wie die lineare Regression auszuführen, und gehen dann zu komplexeren Modellen über, die häufig zur Lösung von realen Problemen in den Biowissenschaften verwendet werden. Im Machine Learning wird ein Datensatz zunächst in einen Trainingsdatensatz, der zur Entwicklung des Models genutzt wird, und einen Testdatensatz, anhand dessen die Leistung des Modells ermittelt wird, aufgeteilt. In Kapitel 2 besprechen wir einige Details rund um Training und Validierung von Vorhersagemodellen. Sobald ein Modell erzeugt wurde, kann seine Leistung in der Regel durch Anpassen mehrerer Parameter, auch bekannt als Hyperparameter, optimiert werden. Das Kapitel gibt einen Überblick über diesen Ablauf. Deep Learning ist keine für sich stehende Technik, sondern beinhaltet eine Reihe verwandter Methoden. Kapitel 2 endet mit einer Einführung in einige der wichtigsten Deep-Learning-Varianten.

    In Kapitel 3 stellen wir DeepChem vor, eine Open-Source-Programmbibliothek, die eigens entwickelt wurde, um die Erstellung von Deep-Learning-Modellen für eine Vielzahl biowissenschaftlicher Anwendungen zu vereinfachen. Nach dem Überblick über DeepChem stellen wir unser erstes Programmierbeispiel vor, das zeigt, wie mit der DeepChem-Bibliothek ein Modell zur Vorhersage der Toxizität von Molekülen erstellt werden kann. In einem zweiten Programmierbeispiel zeigen wir, wie mit DeepChem Bilder klassifiziert werden können, eine in der modernen Biologie häufig anzutreffende Aufgabe. Wie bereits kurz erwähnt, wird Deep Learning in einer Vielzahl von bildgebenden Verfahren eingesetzt, die von der Krebsdiagnose bis zur Erkennung von Glaukomen reichen. Die Vorstellung dieser spezifischen Anwendungen mündet dann in eine Erklärung einiger der inneren Funktionsweisen von Deep-Learning-Methoden.

    Kapitel 4 gibt einen Überblick darüber, wie Machine Learning auf Moleküle angewendet werden kann. Wir beginnen mit einer Einführung zu Molekülen, den Bausteinen von allem, das uns umgibt. Obwohl Moleküle mit Bausteinen gleichgesetzt werden können, sind sie nicht starr. Vielmehr sind Moleküle flexibel und zeigen dynamisches Verhalten. Um Moleküle mithilfe eines analytischen Verfahrens wie dem Deep Learning charakterisieren zu können, müssen wir in der Lage sein, Moleküle in einem Computer darzustellen. Diese Codierungen ähneln der Art und Weise, in der ein Bild als eine Ansammlung von Pixeln dargestellt werden kann. Im zweiten Teil von Kapitel 4 beschreiben wir eine Reihe von Darstellungsmöglichkeiten von Molekülen und wie diese Darstellungen in Deep-Learning-Modellen verwendet werden können.

    Kapitel 5 bietet eine Einführung in das Gebiet der Biophysik, bei der die Gesetze der Physik auf biologische Phänomene angewendet werden. Wir beginnen mit Proteinen, den molekularen Maschinen, die das Leben ermöglichen. Eine Schlüsselkomponente für die Vorhersage von Arzneimittelauswirkungen auf den Körper ist das Verständnis ihrer Wechselwirkungen mit Proteinen. Um diese Effekte zu verstehen, beginnen wir mit einem Überblick darüber, wie Proteine aufgebaut sind und wie sich die Proteinstrukturen unterscheiden. Proteine sind Entitäten, deren 3-D-Struktur ihre biologische Funktion bestimmt. Damit ein Machine-Learning-Modell den Einfluss eines Wirkstoffmoleküls auf die Funktion eines Proteins vorhersagen kann, müssen wir diese 3-D-Struktur in eine Form bringen, die von einem Machine-Learning-Programm verarbeitet werden kann. Im zweiten Teil von Kapitel 5 untersuchen wir eine Reihe von Möglichkeiten, wie Proteinstrukturen dargestellt werden können. Mit dem nun vorhandenen Wissen betrachten wir ein weiteres Codebeispiel, in dem wir Deep Learning verwenden, um vorherzusagen, inwieweit ein Wirkstoffmolekül mit einem Protein interagieren wird.

    Die Genetik ist zu einer Schlüsselkomponente der heutigen Medizin geworden. Die genetische Tumorsequenzierung hat personalisierte Krebstherapien ermöglicht und das Potenzial, die Medizin zu revolutionieren. Die ehemals komplexe und sehr kostenintensive Gensequenzierung ist heutzutage alltäglich und wird routinemäßig durchgeführt. Wir haben sogar den Punkt erreicht, an dem Hundebesitzer kostengünstige Gentests bekommen können, um die Abstammungslinie ihrer Haustiere zu bestimmen. In Kapitel 6 geben wir einen Überblick über Genetik und Genomik und beginnen mit einer Einführung in DNA und RNA, die Vorlagen der Proteinherstellung. Jüngste Entdeckungen haben enthüllt, dass die Wechselwirkungen zwischen DNA und RNA viel komplexer sind, als ursprünglich angenommen. In der zweiten Hälfte von Kapitel 6 stellen wir einige Codebeispiele vor, die zeigen, wie mithilfe von Deep Learning mehrere Faktoren vorhergesagt werden können, die die Wechselwirkungen von DNA und RNA beeinflussen.

    Wir haben in diesem Kapitel bereits auf die vielen Fortschritte hingewiesen, die auf der Anwendung von Deep Learning auf die Analyse biologischer und medizinischer Bilder basieren. Viele der in diesen Experimenten untersuchten Phänomene sind zu klein, um mit bloßem Auge beobachtet werden zu können. Um die Bilder zu erhalten, die für Deep-Learning-Methoden benötigt werden, müssen wir ein Mikroskop benutzen. Kapitel 7 gibt einen Überblick über die unzähligen Formen der Mikroskopie, angefangen mit dem einfachen Lichtmikroskop, das wir alle aus der Schule kennen, bis hin zu hoch entwickelten Instrumenten, die in der Lage sind, Bilder in atomarer Auflösung zu machen. Des Weiteren werden einige der Grenzen aktueller Ansätze aufgezeigt und Informationen zu den experimentellen Pipelines gegeben, um die Bilder für Deep-Learning-Modelle zu erhalten.

    Ein sehr vielversprechender Bereich ist die Anwendung von Deep Learning für medizinische Diagnosen. Die Medizin ist unglaublich komplex, und kein Arzt kann das gesamte verfügbare medizinische Wissen in sich vereinen. Im Idealfall könnte ein Machine-Learning-Modell die medizinische Literatur verarbeiten und Mediziner beim Stellen von Diagnosen unterstützen. Obwohl wir so weit noch nicht sind, sind wir auf einem guten Weg. Kapitel 8 beginnt mit der Geschichte des Machine Learning im Stellen von Diagnosen und skizziert den Übergang von manuell codierten Regeln hin zur statistischen Analyse der medizinischen Ergebnisse. Wie bereits bei vielen anderen Themen angesprochen, ist ein wichtiger Bestandteil die Darstellung medizinischer Informationen in einem Format, das ein Machine-Learning-Programm verarbeiten kann. In diesem Kapitel stellen wir die elektronische Patientenakte vor und weisen auf einige der Probleme hin, die diese Aufzeichnungen betreffen. Oftmals sind medizinische Bilder sehr komplex, und die Auswertung sowie die Interpretation dieser Bilder gestalten sich selbst für erfahrene Spezialisten schwierig. In diesen Fällen kann Deep Learning die Fähigkeiten eines Menschen erweitern, indem Bilder klassifiziert und Schlüsselmerkmale identifiziert werden. Kapitel 8 schließt mit einer Reihe von Beispielen dafür, wie Deep Learning in einer Vielzahl von Bereichen zur Analyse medizinischer Bilder verwendet wird.

    Wie bereits erwähnt, ist Machine Learning ein wichtiger Bestandteil der Suche nach neuen Wirkstoffen. Wissenschaftler wenden Deep Learning an, um die Wechselwirkungen zwischen Wirkstoffmolekülen und Proteinen auszuwerten. Diese Wechselwirkungen können biologische Reaktionen hervorrufen, die therapeutische Auswirkungen für einen Patienten haben. Die Modelle, die wir bisher besprochen haben, waren diskriminative Modelle. Ausgehend von einer Reihe von Eigenschaften eines Moleküls erstellt das Modell eine Vorhersage einer anderen Eigenschaft. Diese Vorhersagen benötigen ein Input-Molekül, das aus einer Datenbank vorhandener Moleküle oder der Fantasie eines Wissenschaftlers entstammen kann. Was wäre, wenn wir uns nicht auf Vorhandenes oder der Fantasie Entstammendes verlassen müssten, sondern ein Computerprogramm hätten, das neue Moleküle »erfinden« könnte? Kapitel 9 stellt eine weitere Methode des Deep Learning vor, das generative Modell. Ein generatives Modell wird zunächst auf verfügbaren Molekülen trainiert und anschließend genutzt, um neue Moleküle zu erzeugen. Das Deep-Learning-Programm, das diese Moleküle erzeugt, kann auch durch weitere Modelle beeinflusst werden, die die Aktivität der neuen Moleküle vorhersagen.

    Bisher haben wir Deep-Learning-Modelle als »Blackboxes« betrachtet. Das Modell erhält Eingabedaten und erstellt eine Vorhersage, jedoch ohne jegliche Erklärung dazu, wie oder warum die Vorhersage erzeugt wurde. Diese Art der Vorhersage kann in vielen Situationen suboptimal sein. Wenn wir ein Deep-Learning-Modell zum Stellen von Diagnosen haben, wollen wir in der Regel die Gründe für die Diagnose verstehen. Eine Erklärung der Gründe für die Diagnose gibt dem Arzt mehr Vertrauen in die Vorhersage und kann auch die Entscheidungen bezüglich einer Therapie beeinflussen. Ein historischer Wermutstropfen beim Deep Learning ist die Tatsache, dass die Modelle, obwohl oft zuverlässig, schwierig zu deuten sind. Derzeit werden Techniken entwickelt, die den Benutzern ermöglichen sollen, zu verstehen, welche Faktoren zu einer Vorhersage geführt haben. Kapitel 10 gibt eine Übersicht zu einigen dieser Techniken, die das menschliche Verständnis von Vorhersagemodellen ermöglicht. Ein weiterer wichtiger Aspekt von Vorhersagemodellen ist die Genauigkeit der Vorhersagen. Das Verständnis für die Genauigkeit eines Modells kann uns dabei helfen, festzustellen, wie sehr wir uns auf dieses Modell verlassen können. Da mit Machine Learning möglicherweise lebensrettende Diagnosen gestellt werden können, ist das Verständnis der Modellgenauigkeit von entscheidender Bedeutung. Im letzten Abschnitt von Kapitel 10 geben wir einen Überblick über einige der Techniken, mit denen sich die Genauigkeit eines Modells beurteilen lässt.

    In Kapitel 11 stellen wir eine reale Fallstudie unter Verwendung von DeepChem vor. In diesem Beispiel verwenden wir ein Verfahren namens »virtuelles Screening«, um mögliche Ausgangspunkte für die Entdeckung neuer Medikamente zu identifizieren. Die Entdeckung neuer Arzneimittel ist ein komplexer Prozess, der häufig mit einer Technik beginnt, die als Screening bekannt ist. Durch Screening werden Moleküle identifiziert, die optimiert werden können, um schließlich Medikamente zu erzeugen. Das Screening kann experimentell durchgeführt werden, wobei Millionen von Molekülen in miniaturisierten biologischen Tests, auch bekannt als Assays, getestet werden, oder unter Verwendung des virtuellen Screenings am Computer. Beim virtuellen Screening werden bekannte Medikamente oder andere biologisch aktive Moleküle genutzt, um ein Machine-Learning-Modell zu trainieren. Dieses Modell wird dann zur Vorhersage der Aktivität einer großen Menge von Molekülen verwendet. Dank der hohen Geschwindigkeit der Machine-Learning-Methoden können Hunderte Millionen Moleküle meist innerhalb weniger Tage verarbeitet werden.

    Im letzten Kapitel dieses Buchs untersuchen wir die aktuellen Auswirkungen und das zukünftige Potenzial von Deep Learning in den Biowissenschaften. Eine Reihe von Herausforderungen der aktuellen Bemühungen, einschließlich der Verfügbarkeit und Qualität von Datensätzen, werden besprochen. Des Weiteren zeigen wir Chancen und mögliche Fallstricke in anderen Bereichen auf, darunter Diagnostik, personalisierte Medizin, pharmazeutische Entwicklung und biologische Forschung.

    KAPITEL 2

    Einführung in Deep Learning

    Dieses Kapitel führt Sie in die Grundprinzipien von Deep Learning ein. Sollten Sie bereits über einiges an Erfahrung mit Deep Learning verfügen, können Sie dieses Kapitel auch nur überfliegen und dann zum nächsten gehen. Falls Sie weniger Erfahrung haben, sollten Sie dieses Kapitel sorgfältig lesen, da das darin enthaltene Wissen für das weitere Verständnis des Buchs unentbehrlich ist.

    Bei den meisten Aufgabenstellungen, die wir behandeln werden, besteht unsere Arbeit darin, eine mathematische Formel zu erstellen:

    y = f(x)

    Beachten Sie bitte, dass x und y fett geschrieben sind. Das bedeutet, hierbei handelt es sich um Vektoren. Eine Funktion kann viele Eingabewerte haben, möglicherweise Tausende oder gar Millionen, und viele Ausgabewerte erzeugen. Hier einige Funktionsbeispiele:

    x enthält die Farben aller Pixel eines Bilds. f(x) ergibt 1, wenn auf dem Bild eine Katze abgebildet ist, und 0, wenn das nicht der Fall ist.

    Das Gleiche wie oben, außer dass f(x) ein Vektor von Zahlen ist. Das erste Element zeigt an, ob das Bild eine Katze enthält, das zweite, ob es sich um einen Hund handelt, das dritte, ob ein Flugzeug zu sehen ist, und so weiter für Tausende von Objekten.

    x beinhaltet die DNA-Sequenz eines Chromosoms. y ist ein Vektor, dessen Länge der Anzahl der Basen im Chromosom entspricht. Jedes Element ergibt 1, wenn diese Base Teil einer Region ist, die für ein Protein codiert, und 0, falls nicht.

    x beschreibt die Struktur eines Moleküls. (Wir besprechen die verschiedenen Darstellungsmöglichkeiten von Molekülen in späteren Kapiteln.) y stellt einen Vektor dar, in dem jedes Element eine physikalische Eigenschaft des Moleküls beschreibt: wie einfach es sich in Wasser auflöst, wie stark es an andere Moleküle bindet usw.

    Wie Sie sehen können, kann es sich bei f(x) um eine sehr komplizierte Funktion handeln! In der Regel wird ein langer Vektor als Eingabe verwendet, aus dem versucht wird, Informationen zu extrahieren, die nur anhand der eingegebenen Zahlen nicht ersichtlich sind.

    Der übliche Ansatz zur Lösung dieser Aufgabenstellung besteht darin, eine Funktion von Hand zu entwerfen. Sie würden damit beginnen, die Aufgabe zu zerlegen. Welche Pixelmuster deuten auf die Anwesenheit einer Katze hin? Welche DNA-Muster neigen dazu, codierende von nicht codierenden Regionen zu unterscheiden? Sie würden Computercode schreiben, um bestimmte Arten von Merkmalen zu erkennen, und dann versuchen, Kombinationen von Merkmalen zu identifizieren, die zuverlässig das beabsichtigte Ergebnis erzeugen. Dieser Ablauf ist langsam und arbeitsaufwendig und hängt stark von den Fachkenntnissen des Auszuführenden ab.

    Machine Learning geht ganz anders vor. Anstatt eine Funktion von Hand zu entwerfen, ermöglichen Sie dem Computer, seine eigene Funktion anhand von Daten zu erlernen. Sie sammeln Tausende oder Millionen von Bildern, die jeweils kennzeichnen, ob eine Katze enthalten ist. Sie geben die gesamten Trainingsdaten dem Computer und lassen ihn nach einer Funktion suchen, die für Bilder mit Katzen durchgehend nahe 1 und für die ohne nahe 0 liegt.

    Was bedeutet es, den Computer nach einer Funktion suchen zu lassen? Im Allgemeinen erstellen Sie ein Modell, das eine große Klasse von Funktionen definiert. Die Modelle beinhalten Parameter, das sind Variablen, die einen beliebigen Wert annehmen können. Durch die Wahl der Parameterwerte legen Sie eine bestimmte Funktion aus den vielen Funktionen in der vom Modell definierten Klasse fest. Die Aufgabe des Computers besteht darin, die Werte für die Parameter auszuwählen. Er wird versuchen, die Werte so zu finden, dass bei Verwendung der Trainingsdaten als Eingabe die Ausgabe den entsprechenden Vorgaben möglichst nahekommt.

    Lineare Modelle

    Eines der einfachsten Modelle, die Sie ausprobieren sollten, ist das lineare Modell:

    y = Mx + b

    In dieser Gleichung ist M eine Matrix (manchmal als »Gewicht« bezeichnet), und b ist ein Vektor (auch »Bias« genannt). Ihre Größen werden anhand der Anzahl der Ein- und Ausgabewerte bestimmt. Wenn x die Länge T hat und y die Länge S haben soll, ist M eine S × T-Matrix und b ein Vektor der Länge S. Zusammen bilden sie die Parameter des Modells. Diese Formel besagt einfach, dass jeder Ausgabewert eine lineare Kombination der Eingabewerte ist. Durch Festlegen der Parameter (M und b) können Sie für jede Komponente eine beliebige lineare Kombination auswählen.

    Dies war eines der frühesten Modelle im Machine Learning. Es wurde bereits 1957 eingeführt und Perzeptron genannt. Der Name hat erstaunliches Marketingpotenzial: Er klingt nach Science-Fiction und scheint wundervolle Dinge zu versprechen, obwohl es tatsächlich nichts anderes als eine lineare Transformation ist. Wie auch immer, der Name hat seit mehr als einem halben Jahrhundert Bestand.

    Es ist sehr einfach, das lineare Modell völlig allgemein zu formulieren. Es hat immer

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1