eBook64 Seiten1 Stunde
Text Mining und dessen Implementierung
Von Norman Zänker und Christian Zietzsch
Bewertung: 0 von 5 Sternen
()
Über dieses E-Book
In der heutigen Zeit, in der der Umgang mit Informationsressourcen den Alltag bestimmt, ist es wichtig, dass es Systeme gibt, die gewährleisten, dass für den Nutzer relevante Informationen gesucht und auf die wichtigsten Fakten reduziert werden. Ein Großteil der gespeicherten Informationen, welche extrahiert werden sollen, sind dabei in Form von Textdokumenten vorhanden. Zu diesem Zweck gibt es in der Informatik ein Fachgebiet, das es sich zur Aufgabe gemacht hat, Analysewerkzeuge zur Bearbeitung von natürlich sprachigen Texten zu entwickeln. Diese Entwicklung hatte ihren Ursprung bereits in den Anfängen der Informatik und ist somit eines der ältesten Probleme der IT-Branche. Mit der erhöhten Zugänglichkeit der Informationen steigen die Anforderungen an Informationssysteme, von denen eine automatische Generierung und Aufbereitung von Wissen erwartet wird. Dabei wird die Entwicklung solcher Informationssysteme mit verschiedenen Problemen konfrontiert. Beispielsweise erschwert die schiere Masse an Daten die Auswahl der Informationsquellen. Allein das Volumen des Internets umfasst ca. 75 Mio. Webseiten, ganz zu schweigen von unternehmensinternen Datenbanken, Email-Verkehr und Dokumentenmanagementsysteme, deren Datenvolumen bereits im Jahr 2000 auf 1000 Petabyte geschätzt wurde. Da elektronische Medien in der modernen Zeit immer mehr an Bedeutung gewinnen, steigen auch die gespeicherten Informationen in unaufhaltsamem Maße fast exponentiell an. Dieser Trend wird auch als Information Overload bezeichnet. Erschwerend dabei ist, dass weder die Inhalte, noch der Zweck des Systems im World Wide Web klar definiert sind.
Desweiteren macht die natürliche Sprache der einzelnen Informationsquellen zu schaffen. Solang die Daten strukturiert in einer Datenbank vorliegen, können sie von Informationssystemen ohne Probleme gelesen und die wichtigsten Informationen herausgefiltert werden. Dieses Verfahren ist bekannt unter dem Begriff ‘Data-Mining’. Bei natürlichen Texten liegt jedoch keine feste Datenstruktur vor, da Semantik und Syntax bei der Informationsgewinnung berücksichtigt werden müssen. Hinzu kommt noch, dass statistische Methoden eine große Rolle spielen, um die gewünschten Informationen aus den Texten zu gewinnen. Ohne entsprechende Systeme ist es somit unmöglich, effektiv mit den Informationen aus Texten umzugehen.
Eine Technik, die es dennoch ermöglicht Textdatenbanken zu analysieren und Wissen aus unbekannten Texten zu extrahieren, wird als ‘Text-Mining’ bezeichnet, welches auf den Grundlagen des Data-Mining basiert.
Nichts desto trotz stecken die Analyseverfahren noch in den Kinderschuhen, da die enorme Fülle an Informationen und deren differenzierter sprachlicher Aufbau der Entwicklung zu schaffen macht.
In dieser Studie geben wir grundlegende Einblicke in das Gebiet des Text-Mining, definieren und beschreiben den Prozess, und erläutern die Methodik an einem eigens konzipierten Text-Mining-Tools.
Desweiteren macht die natürliche Sprache der einzelnen Informationsquellen zu schaffen. Solang die Daten strukturiert in einer Datenbank vorliegen, können sie von Informationssystemen ohne Probleme gelesen und die wichtigsten Informationen herausgefiltert werden. Dieses Verfahren ist bekannt unter dem Begriff ‘Data-Mining’. Bei natürlichen Texten liegt jedoch keine feste Datenstruktur vor, da Semantik und Syntax bei der Informationsgewinnung berücksichtigt werden müssen. Hinzu kommt noch, dass statistische Methoden eine große Rolle spielen, um die gewünschten Informationen aus den Texten zu gewinnen. Ohne entsprechende Systeme ist es somit unmöglich, effektiv mit den Informationen aus Texten umzugehen.
Eine Technik, die es dennoch ermöglicht Textdatenbanken zu analysieren und Wissen aus unbekannten Texten zu extrahieren, wird als ‘Text-Mining’ bezeichnet, welches auf den Grundlagen des Data-Mining basiert.
Nichts desto trotz stecken die Analyseverfahren noch in den Kinderschuhen, da die enorme Fülle an Informationen und deren differenzierter sprachlicher Aufbau der Entwicklung zu schaffen macht.
In dieser Studie geben wir grundlegende Einblicke in das Gebiet des Text-Mining, definieren und beschreiben den Prozess, und erläutern die Methodik an einem eigens konzipierten Text-Mining-Tools.
Ähnlich wie Text Mining und dessen Implementierung
Ähnliche E-Books
Python-Programmierung für Germanist:innen: Ein Lehr- und Arbeitsbuch Bewertung: 0 von 5 Sternen0 BewertungenMetakognition: Die Neue Didaktik: Metakognitiv fundiertes Lehren und Lernen ist Grundbildung Bewertung: 0 von 5 Sternen0 BewertungenEinführung in LaTeX Bewertung: 0 von 5 Sternen0 BewertungenEinführung in LaTeX: unter Berücksichtigung von pdfLaTeX, XLaTeX und LuaLaTeX Bewertung: 4 von 5 Sternen4/5Neokognitron und Hopfield Netz als künstliche neuronale Netze zur Mustererkennung: Theorie, computergestützte Simulation und Anwendungen Bewertung: 0 von 5 Sternen0 BewertungenEin Orientierungssystem für Menschen mit Sehbehinderung auf Java ME: Konzeption und Implementierung Bewertung: 0 von 5 Sternen0 BewertungenMETAPOST: Grafk für TeX und LaTeX Bewertung: 0 von 5 Sternen0 BewertungenDer Tod in Danzig: Danziger Leichenpredigten (1586–1746) aus textlinguistischer Sicht Bewertung: 0 von 5 Sternen0 BewertungenFührung aus Mehrebenenperspektive: Die Anwendung der Hierarchisch Linearen Modellierung (HLM) durch die internationale empirische Führungsforschung Bewertung: 0 von 5 Sternen0 BewertungenDer attributive Genitiv und seine Alternativformen in der Familiensprache Bewertung: 0 von 5 Sternen0 BewertungenSelbststudium – Die Lehrmethode von morgen: Wie Lernmaterialien das Selbststudium mithilfe von hypermedialen Elementen erfolgreich machen Bewertung: 0 von 5 Sternen0 BewertungenBibelauslegung: Grundlagen – Textanalysen – Praxisfelder Bewertung: 0 von 5 Sternen0 BewertungenEntsteht hier ein Cluster? Eine Netzwerkanalyse der Bochumer IT-Sicherheitsbranche Bewertung: 0 von 5 Sternen0 BewertungenVergleich und Evaluation zwischen modernen und traditionellen Datenbankkonzepten unter den Gesichtspunkten Skalierung, Abfragemöglichkeit und Konsistenz Bewertung: 0 von 5 Sternen0 BewertungenGesprächslinguistik: Eine Einführung Bewertung: 0 von 5 Sternen0 BewertungenQuellenarbeit im Geschichtsunterricht: Die empirische Rekonstruktion von Kompetenzerwerb im Umgang mit Quellen Bewertung: 0 von 5 Sternen0 BewertungenGermanistische Linguistik: Eine Einführung Bewertung: 5 von 5 Sternen5/5PSTricks: Grafik mit PostScript für TeX und LaTeX Bewertung: 5 von 5 Sternen5/5HaptOSM: Kostengünstige Kartenherstellung für blinde und sehbehinderte Menschen Bewertung: 0 von 5 Sternen0 BewertungenStatistik und quantitative Forschungsmethoden: Lehr- und Arbeitsbuch für die Soziale Arbeit und (Sozial-)Pädagogik Bewertung: 0 von 5 Sternen0 BewertungenEffiziente Datenanalyse in Netzwerkgraphen: Durch User Defined Functions in PostgreSQL Bewertung: 0 von 5 Sternen0 BewertungenVerständlichkeitsforschung transdisziplinär: Plädoyer für eine anwenderfreundliche Wissensgesellschaft Bewertung: 0 von 5 Sternen0 BewertungenKorpuslinguistik: Eine Einführung Bewertung: 0 von 5 Sternen0 BewertungenDie systemische Metaphern-Schatzkiste: Grundlagen und Methoden für die Beratungspraxis Bewertung: 0 von 5 Sternen0 BewertungenEinführung in das Studium der lateinischen Literatur: Ein Arbeitsbuch Bewertung: 0 von 5 Sternen0 BewertungenBig Data mit Hadoop und Hive: Untersuchung der Migration einer MySQL-basierten Monitoring & Data Warehouse Lösung nach Hadoop Bewertung: 0 von 5 Sternen0 BewertungenOpen History: Archäologie des Retrocomputings Bewertung: 0 von 5 Sternen0 BewertungenSystematische Literaturanalysen in den Sozialwissenschaften: Eine praxisorientierte Einführung Bewertung: 0 von 5 Sternen0 BewertungenBusiness Rules – Geschäftsregeln: Konzepte, Modellierungsansätze, Softwaresysteme Bewertung: 0 von 5 Sternen0 Bewertungen
Informationstechnologie für Sie
Agiles Requirements Engineering und Testen Bewertung: 0 von 5 Sternen0 BewertungenKompaktes Managementwissen: Die Grunstruktur agiler Prozesse Bewertung: 0 von 5 Sternen0 BewertungenAndroid-Entwicklung für Einsteiger - 20.000 Zeilen unter dem Meer: 2. erweiterte Auflage Bewertung: 0 von 5 Sternen0 BewertungenBusiness-Intelligence-Lösungen für Unternehmen Bewertung: 0 von 5 Sternen0 BewertungenKnigge für Softwarearchitekten. Reloaded Bewertung: 0 von 5 Sternen0 BewertungenErfolgreich bewerben in der IT - die besten Praxistipps von A wie (Anschreiben) bis Z (wie Zeugnis) Bewertung: 0 von 5 Sternen0 BewertungenEinplatinencomputer - ein Überblick Bewertung: 0 von 5 Sternen0 BewertungenBlockchain: Praktische Anwendungen, Praktisches Verständnis Bewertung: 0 von 5 Sternen0 BewertungenZertifizierung für Softwarearchitekten: Ihr Weg zur iSAQB-CPSA-F-Prüfung Bewertung: 0 von 5 Sternen0 Bewertungen
Rezensionen für Text Mining und dessen Implementierung
Bewertung: 0 von 5 Sternen
0 Bewertungen
0 Bewertungen0 Rezensionen
Buchvorschau
Text Mining und dessen Implementierung - Norman Zänker
Gefällt Ihnen die Vorschau?
Seite 1 von 1