Beschreibung
Wissen und Text (Text Mining Aufbau & Struktur v. Text, Wissensverarb. gestern & heute) 2 Grundl. der Bedeutungsanalyse ( Syntagmat. Relationen, Paradigmat. Rel., Semantische Rel., Logische Rel., Fach- & Allgemeinsprache) 3 Textdatenbanken (Textressourcen, Aufbau v. Textdatenbanken, Segmentierung v. Text, Datenstrukturen, Abfragemöglichkeiten) 4 Sprachstatistik (Zipfsche Gesetze, Differenzanalyse, Probabilistisches Sprachmodell, Hidden Markov-Modelle, Tagging, Signifikante Kookkurrenzen, Visualisierung von sign. Kookk., Anwend. auf andere Sprachen, Kookk. höherer Ordnung, Netze v. Kookkurrenten, Small Worlds u. skalenfreie Netze, Disambiguierung, Communities) 5 Clustering (Clustering-Verfahren, Dokumentenähnlichkeit, Clustern v. Wortformen, Merkmalsextraktion) 6 Musteranalyse (Reguläre Ausdrücke, Syntaktische Muster, Morphemmuster) 7 Hybride Verfahren (Lexikalische Filter, Kombination versch. Wissensquellen, Bootstrapping 8 Beispielanwendungen / Anhang (Ling. Grundlagen u. Statistik). Leseprobe"Text repräsentiert Wissen. Im Unterschied zu den strukturierten Daten einer Datenbank stellen Texte unstrukturierte Daten dar. Mit Hilfe von Text Mining-Werkzeugen können aus digital vorliegenden Texten neue und relevante sachliche und inhaltliche Zusammenhänge extrahiert werden. Text Mining basiert auf statistischen und musterbasierten Verfahren und erlaubt innovative Anwendungen im Wissensmanagement. Auf allen Ebenen der Wertschöpfungsketten spielt der gezielte Umgang mit Wissen eine zunehmend wichtige Rolle für die Effektivität und Effizienz von insbesondere mittleren und großen Unternehmen. Der Terminus Wissen bezeichnet dabei die meist auf Erfahrung beruhende und objektiv nachprüfbare Kenntnis von Fakten und Zusammenhängen eines Weltausschnitts, die Personen zur Lösung von Problemen einsetzen." Ein großer Teil des Weltwissens liegt in Form digitaler Texte im Internet und in Intranets. Diese digitalen Texte - die in den meisten natürlichen Sprachen vorliegen - stellen einen bedeutsamen und bisher kaum genutzten Wissensrohstoff dar. Lernen Sie in diesem ersten deutschen Lehrbuch zu diesem Thema, wie digitaler Text mit Hilfe des 'Text Mining' für das Wissensmanagement aufbereitet, verarbeitet und genutzt werden kann. Die behandelten Themen in diesem Buch: Wissen und Text, Grundlagen der Bedeutungsanalyse, Textdatenbanken, Sprachstatistik, Clustering, Musteranalyse, Hybride Verfahren, Beispielanwendungen, Anhänge: Statistik und linguistische Grundlagen
Autorenportrait
Prof. Heyer ist Dekan der Fakultät für Mathematik und Informatik und Professor für Automatische Sprachverarbeitung am Institut für Informatik der Universität Leipzig. Die Forschungsschwerpunkte des Lehrstuhls liegen in der automatischen semantischen Analyse von Texten und deren Anwendung im Content Management sowie der Sprach- und Wissensverarbeitung. Prof. Heyer war von 1985 bis 1993 im Rahmen der Olivetti-Gruppe verantwortlich für das Technologiemarketing und die Entwicklung von Sprach- und Multimediaprodukten bei der TA Triumph-Adler AG in Nürnberg. Im Zuge eines Management Buy-Outs hat er 1993 die EP Electronic Publishing GmbH gegründet. Das auf die Entwicklung von Translation Memory Systemen, Terminologieverwaltungs- und Redaktionssystemen spezialisierte Unternehmen ist 1999 an ein Nasdaq notiertes Unternehmen verkauft worden. In den letzten Jahren hat sich Prof. Heyer wieder verstärkt der Forschung, speziell der Verarbeitung des Wissensrohstoffs Text durch Text Mining, zugewandt.
Leseprobe
Text repräsentiert Wissen. Im Unterschied zu den strukturierten Daten einer Datenbank stellen Texte unstrukturierte Daten dar. Mit Hilfe von Text Mining-Werkzeugen können aus digital vorliegenden Texten neue und relevante sachliche und inhaltliche Zusammenhänge extrahiert werden. Text Mining basiert auf statistischen und musterbasierten Verfahren und erlaubt innovative Anwendungen im Wissensmanagement. Auf allen Ebenen der Wertschöpfungsketten spielt der gezielte Umgang mit Wissen eine zunehmend wichtige Rolle für die Effektivität und Effizienz von insbesondere mittleren und großen Unternehmen. Der Terminus Wissen bezeichnet dabei die meist auf Erfahrung beruhende und objektiv nachprüfbare Kenntnis von Fakten und Zusammenhängen eines Weltausschnitts, die Personen zur Lösung von Problemen einsetzen
Inhalt
1 Wissen und Text (Text Mining Aufbau & Struktur v. Text, Wissensverarb. gestern & heute) 2 Grundl. der Bedeutungsanalyse ( Syntagmat. Relationen, Paradigmat. Rel., Semantische Rel., Logische Rel., Fach- & Allgemeinsprache) 3 Textdatenbanken (Textressourcen, Aufbau v. Textdatenbanken, Segmentierung v. Text, Datenstrukturen, Abfragemöglichkeiten) 4 Sprachstatistik (Zipfsche Gesetze, Differenzanalyse, Probabilistisches Sprachmodell, Hidden Markov-Modelle, Tagging, Signifikante Kookkurrenzen, Visualisierung von sign. Kookk., Anwend. auf andere Sprachen, Kookk. höherer Ordnung, Netze v. Kookkurrenten, Small Worlds u. skalenfreie Netze, Disambiguierung, Communities) 5 Clustering (Clustering-Verfahren, Dokumentenähnlichkeit, Clustern v. Wortformen, Merkmalsextraktion) 6 Musteranalyse (Reguläre Ausdrücke, Syntaktische Muster, Morphemmuster) 7 Hybride Verfahren (Lexikalische Filter, Kombination versch. Wissensquellen, Bootstrapping 8 Beispielanwendungen / Anhang (Ling. Grundlagen u. Statistik)