Warning : Cannot modify header information - headers already sent by (output started at /var/www/vhosts/wissensexploration.de/htdocs/literatur.php:2) in /var/www/vhosts/wissensexploration.de/htdocs/inc/functions.inc.php on line 2
Literatur: Text Mining, Web Mining, Fokussierte Web Crawler, Web Information Retrieval, Data Mining & KDD, Software, Literatur.
Wissensexploration.de Knowledge Mining & Discovery: Text, Web und Data Mining, Suchtechnologien, explorative Datenanalyse
| Web Crawling Strategien und Information Retrieval im Web, fokussierte Web Crawler, semantisches Wissen
und Informationsextraktion | > Empowering Business Intelligence.
Literatur Text Mining, Web Mining, Data Mining, Information Retrieval, Web Crawling
Alpar, Paul und Niederreichholz, Joachim (2000), Data Mining im praktischen Einsatz: Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung, Vieweg Verlag, Wiesbaden, Deutschland.
Arasu, Arvind; Cho, Junghoo; Garcia-Molina, Hector; Paepcke, Andreas und Raghavan, Sriram (2000), Searching the Web , Technical Report, Stanford University, USA, Online: http://dbpubs.stanford.edu/pub/showDoc.Fulltext ?lang=en&doc=2000-37&format=pdf&compression=&name=2000-37.pdf [20.11.2006]
Baeza-Yates, Ricardo; Castillo, Carlos; Marin, Mauricio und Rodriguez, Andrea (2005), Crawling a country : better strategies than breadth-first for web page ordering, in: WWW '05: Special interest tracks and posters of the 14th international conference on World Wide Web, Chiba, Japan, Seiten 864-872.
Baeza-Yates, Ricardo und Ribeiro-Neto, Berthier (1999), Modern Information Retrieval , Addison-Wesley Longman Publishing Co., Boston, MA, USA.
Bergmark, Donna; Lagoze, Carl und Sbityakov, Alex (2002), Focused Crawls, Tunneling, and Digital Libraries , in: 6th European Conference on Digital Libraries 2002, Rom, Italien, Online: http://citeseer.ist.psu.edu/bergmark02focused.html [18.11.2006]
Berners-Lee, Tim; Hendler, J. und Lassila, O. (2001), The semantic Web . Scientific American, 284(5), o.O., Online: http://wireless.ictp.trieste.it/school_2002/lectures/ canessa/0501berners-lee.ps [18.11.2006]
Blumauer, Andreas; Pellegrini, Tassilo (2006). Semantic Web und semantische Technologien. Zentrale Begriffe und Unterscheidungen. In: Pellegrini, Tassilo; Blumauer, Andreas (Hg.): Semantic Web. Wege zur vernetzten Wissensgesellschaft. Berlin: Springer Verlag, S. 9 – 27
Bra, Paul, De; Houben, Geert-Jan; Kornatzky, Yoram und Post, Reinier (1994), Information retrieval in the World-Wide Web : Making client-based searching feasible, Computer Networks and ISDN Systems 27 (2), Amsterdam, Niederlande, Seite 183-192, Online: http://citeseer.ist.psu.edu/debra94information.html [20.11.2006]
Brin, Sergey und Page, Larry (1998), The Anatomy of a Large-Scale Hypertextual Web Search Engine , in: Computer Networks and ISDN Systems, Volume 30, Issues 1-7, Brisbane, Australien, Seite 107-117, Online: http://infolab.stanford.edu/~backrub/google.html [19.11.2006]
Carstensen, Kai-Uwe; Ebert, Christian; Endriss, Cornelia; Jekat Susanne und Klabunde, Ralf (2004), Computerlinguistik und Sprachtechnologie . Eine Einführung, 2. Auflage, Spektrum Akademischer Verlag, Heidelberg, Deutschland.
Chakrabarti, Soumen (2000), Data Mining for Hypertext : A Tutorial Survey, SIGKDD: SIGKDD Explorations: Newsletter of the Special Interest Group (SIG) on Knowledge Discovery & Data Mining, Volume 2, Issue 1, o.O., Seite 1-10.
Chakrabarti, Soumen (2003), Mining the Web : Discovering Knowledge from Hypertext Data, Morgan-Kauffman, San Francisco, USA.
Chakrabarti, Soumen; Berg, Martin, van den und Dom, Byron (1999), Focused crawling : a new approach to topic-specific Web resource discovery, in: Proceedings of 8th International World Wide Web Conference (WWW8), Toronto, Kanada, Seite 545-562, Online: http://www.cs.berkeley.edu/~soumen/doc/www1999f/pdf/www1999f.pdf [01.11.06]
Chakrabarti Soumen; Punera, Kunal; Subramayam, Mallela (2002), Accelerated focused crawling through online relevance feedback , in: WWW2002: Proceedings of the eleventh international world wide web conference, Hawaii, USA, Online: http://www2002.org/CDROM/refereed/336/index.html [18.11.2006]
Chau, Michael und Chen, Hsinchun (2003), Comparison of three vertical search spiders , in: Computer, Volume 36, Number 5, IEEE Computer Society Society, Los Alamitos, CA, USA, Seite 56-62.
Couvering, Elizabeth, Van (2004), New Media? A Political Economy of Search Engines , Conference of the International Association of Media & Communications Researchers (IAMCR), Porto Alegre, Brasilien, Online: http://personal.lse.ac.uk/VANCOUVE/ IAMCR-CTP_SearchEnginePoliticalEconomy_EVC_2004-07-14.pdf [18.11.2006]
Eikvil, Line (1999), Information Extraction from WWW – A Survey, Technical report 945, Norweigan Computing Center, Oslo, Norwegen.
Ehrig, Marc; Hartmann, Jens und Schmitz, Christoph (2004), Ontologiebasiertes Web Mining , in: Informatik 2004: Informatik verbindet, Beiträge der 34. Jahrestagung der Gesellschaft für Informatik e.V., Köllen Druck+Verlag GmbH, Bonn, Deutschland, Seite 187 – 193, Online: http://www.uni-karlsruhe.de/WBS/meh/publications/ehrig04metis.pdf [01.11.2006]
Ehrig, Marc und Maedchen, Alexander (2003), Ontology-focused crawling of Web documents , in: Proceedings of the 2003 ACM symposium on Applied computing, Melbourne, Florida, Online: http://www.aifb.uni-karlsruhe.de/WBS/meh/publications/ehrig03ontology.pdf [01.11.2006]
Etzioni, Oren (1996), The World-Wide Web: Quagmire or Gold Mine? , Communications of the ACM, Vol. 39, No. 11, o.O., Seite 65-68.
Fan, Weiguo; Wallace, Linda; Rich, Stephanie und Zhang, Zhongju (2005), Tapping into the power of text mining , Communications of ACM, Volume 49, Number 2, o.O., Seite 76-82, Online: http://pubs.dlib.vt.edu:9090/2/01/text_mining_final_preprint.pdf [19.11.06]
Fayyad, Usama; Piatetsky-Shapiro, Gregory und Smyth Padhraic (1996), From Data Mining to Knowledge Discovery in Databases , AI Magazine, American Association for Artificial Intelligence, California, USA, Seite 37-54.
Ferber, Reginald (2003), Information Retrieval : Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, Heidelberg, Deutschland.
Filliben, James (2004), NIST/SEMATECH e-Handbook of Statistical Methods , o.O., Online: http://www.itl.nist.gov/div898/handbook/eda/section1/eda11.htm [01.11.2006]
Fürnkranz, Johannes (1999), Exploiting structural Information for Text Classification on the WWW , In: IDA '99: Proceedings of the 3rd Symposium on Intelligent Data Analysis, Amsterdam, Holland, Seite 487-498.
Gao, Li; Chang, Elizabeth und Han, Song (2005), Powerful Tool to Expand Business Intelligence:Text Mining , In: Enformatika Volume 8, Budapest, Ungarn, S. 110-116, Online: http://www.enformatika.org/data/v8/v8-20.pdf [01.11.06]
Glover, Eric J.; Tsioutsiouliklis, Kostas; Lawrence, Steve; Pennock, David M.; Flake, Gary W. (2002), Using Web Structure for Classifying and Describing Web Pages , In: Proceedings of the 11th international conference on World Wide Web, Honolulu, Hawaii, USA, Online: http://citeseer.comp.nus.edu.sg/603741.html [19.11.2006]
Görz, G.; Rollinger, C. und Schneeberger, J. (2000), Einführung in die künstliche Intelligenz , Oldenbourg Verlag, München, Deutschland, Online: http://www-ai.cs.uni-dortmund.de/lehre/vorlesungen/mlrn/skript/handbuch_ki-ml.pdf [01.11.06]
Cunningham, Hamish (2005), Information Extraction, Automatic , in: Encyclopedia of Language and Linguistics, 2nd Edition, Elsevier, Oxford, Großbritannien, Online: http://gate.ac.uk/sale/ell2/ie/main.pdf [19.11.06]
Hersovici, Michael; Jacovi, Michal; Maarek, Yoelle S.; Pelleg, Dan; Shtalhaim, Menanchem; und Ur, Sigalit (1998), The shark-search algorithm . An application: tailored Web site mapping, In: Proceedings of the seventh international conference on World Wide Web 7, Brisbane, Australien, S. 317-326, Online: http://www.cs.cmu.edu/~dpelleg/bin/360.html [20.11.2006]
Hippner, Hajo; Merzenich, Melanine und Wilde, Klaus D. (2002), Der Prozess des Data Mining im Marketing , In: Klaus D. Wilde, Hajo Hippner, Melanie Merzenich (Herausgeber), Data Mining: Mehr Gewinn aus Ihren Kundendaten, Verlagsgruppe Handelsblatt, Düsseldorf, Deutschland, Seite 9-53.
Hippner, Hajo und Rentzmann, René (2006), Text Mining , In: Informatik Spektrum, Volume 29, Nr. 4, Sprinter Verlag, Heidelberg, Deutschland, Seite 287-290.
Wilde, Klaus; Hippner, Hajo und Merzenich, Melanine (2002), Data Mining : Mehr Gewinn aus Ihren Kundendaten, Verlagsgruppe Handelsblatt, Düsseldorf, Deutschland.
Keim, Daniel A. (2002), Datenvisualisierung und Data Mining , In: Datenbank-Spektrum – Zeitschrift für Datenbanktechnologie und Information Retrieval, Nr. 2/2002, dpunkt Verlag, Heidelberg, Deutschland, Seite 30-39.
Kleinberg, Jon (1998), Authoritative sources in a hyperlinked environment , In: Proceedings of the Nineth Annual ACM-SIAM Symposium on Discrete Algorithms, Volume 15, o.O., 1998, Online: http://www.cs.cornell.edu/home/kleinber/auth.pdf [10.11.2006]
Kosala, Raymond und Blockeel, Hendrik (2000), Web Mining Research: A Survey , SIGKDD Explorations: Newsletter of the Special Interest Group (SIG) on Knowledge Discovery & Data Mining, ACM, Volume 2, Issue 1, o.O., Seite 1-10, Online: http://www.acm.org/sigs/sigkdd/explorations/issues/2-1-2000-06/kosala.pdf [01.11.06]
Lewandowski, Dirk (2005), Web Information Retrieval : Technologien zur Informationssuche im Internet, DGI-Schrift (Informationswissenschaft 7), Dinges & Frick GmbH, Frankfurt am Main, Deutschland.
Lewandowski, Dirk (2006), Aktualität als erfolgskritischer Faktor bei Suchmaschinen , in: IWP - Information: Wissenschaft und Praxis 56(2005)1, Frankfurt am Main, Deutschland, Seite 141-148.
Loh, Stanley; Krug Wives, Leandro; Oliveira, José Palazzo, de (2000), Concept-Based Knowledge Discovery in Texts Extracted from the Web , SIGKDD Explorations, Volume 2, Issue 1, o.O., S. 29-39.
Mayr, Philipp und Tosques, Fabio (2005), Webometrische Analysen mit Hilfe der Google Web APIs in Information: Wissenschaft und Praxis 56(1), Frankfurt am Main, Deutschland, Online: http://eprints.rclis.org/archive/00003143/01/Mayr_Tosques_IWP05.pdf [08.08.2007]
McCallum, Andrew (2005), Information Extraction : Distilling Structured Data from unstructured Text, ACM Queue, Volume 3, Issue 9, New York, USA.
Mehler, Alexander und Wolff, Christian (2005), Einleitung: Perspektiven und Positionen des Text Mining , In: Zeitschrift für Computerlinguistik und Sprachtechnologie, Band 20, Heft 1, Seite 1-18, Regensburg, Deutschland.
Neumann, Günter (2001), Informationsextraktion , in: Computerlinguistik und Sprachtechnologie – Eine Einführung, Spektrum Akademischer Verlag, Berlin, Deutschland, Seite 448-516.
Novak, Blaž (2004), A survey of focused web crawling algorithms , 7th International Multiconference on Information Society IS'04, Ljubljana, Slovenija. Online: http://kt.ijs.si/Dunja/SiKDD2004/Papers/BlazNovak-FocusedCrawling.pdf [10.11.2006]
o.V. (2001), NStein Technology Whitepaper , Quebec, Kanada, Online: info@nstein.com [08.08.2006]
o.V. (2006a), Online search hits all-time high of 5.7 billion searches , rising 39 percent year-over-year in January 2006, according to Nielsen//Netratings, Nielsen//Netratings, o.O., Online: http://www.nielsen-netratings.com/pr/pr_060302.pdf [19.11.2006]
o.V. techterms.org (2006b), Plain Text , Online:http://www.techterms.org/definition/plaintext [20.11.2006]
O’Reilly, Tim (2005), What is Web 2.0 : Design Patterns and Business Models for the Next Generation of Software, Online: http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html [20.11.2006]
Page, Lawrence; Brin, Sergey; Motwani, Rajeev und Winograd, Terry (1998), The pagerank citation ranking : Bringing order to the web, Technical report, Computer Science Department, Stanford University, USA.
Qin, Jialun; Zhou, Yilu und Chau, Michael (2004), Building Domain-Specific Web Collections for Scientific Digital Libraries : A Meta-Search Enhanced Focused Crawling Method, In: JCDL '04: Proceedings of the 4th ACM/IEEE-CS joint conference on Digital libraries, New York, NY, USA, Seite 135-141.
Rajman, M. und Besanon, R. (1997), Text Mining : Natural Language Techniques and Text Mining Applications, in: Proceedings of the seventh IFIP 2.6 Working Conference on Database Semantics (DS-7), Chapam & Hall IFIP Proceedings series, Leysin, Switzerland, Online: http://citeseer.ist.psu.edu/rajman97text.html [07.11.06]
Mooney, Raymond und Nahm, Yong (2003), Multilingualism and Electronic Language Management : Proceedings of the 4th International MIDP Colloquium, Van Schaik Pub., Bloemfontein, Südafrika, Seite 141-160.
Sizov, Sergej; Biwer, Michael; Graupmann, Jens; Siersdorfer, Stefan; Theobald, Martin; Weikum, Gerhard und Zimmer, Patrick (2003), The BINGO! System for Information Portal Generation and Expert Web Search , The 1st Semiannual Conference on Innovative Data Systems Research (CIDR), Asilomar(CA), Online: http://www-db.cs.wisc.edu/cidr/cidr2003/program/p7.pdf [10.11.2006]
Subramanian, Arumugam (2005), Classification Techniques for Categorization of Hypertext Documents , Report, University of Florida, USA, Online: http://www.cise.ufl.edu/~sa2/pubs/datamining.pdf [01.10.06]
Sullivan, Dan (2001), Document Warehousing and Text Mining : Techniques for Improving Business Operations, Marketing, and Sales, John Wiley & Sons, New York, USA.
Sun, Aixin; Lim, Ee-Peng und Ng, Wee-Keong (2002), Web classification using support vector machine , In: WIDM '02: Proceedings of the 4th international workshop on Web information and data management, McLean, Virginia, USA, Seiten 96-99.
Spiliopoulou, Myra und Winkler, Karsten, (2002), Text Mining auf Handelsregistereinträgen : Der SAS Enterprise Miner im Einsatz, in: Wilde, Klaus; Hippner, Hajo und Merzenich, Melanine (Herausgeber), Data Mining: Mehr Gewinn aus Ihren Kundendaten, Verlagsgruppe Handelsblatt, Düsseldorf, Deutschland, Seite 117-124.
Ullrich, Mike; Maier, Andreas und Angele, Jürgen (2003), Taxonomie, Thesaurus, Topic Map, Ontologie – ein Vergleich, ontoprise Whitepaper Series, Karlsruhe, Deutschland, Online: http://www.ontoprise.de/content/e1276/e1358/e1362/TaxonomieThesaurusTopicMapOntologiev13_ger.pdf [01.11.06]
Weiss, Scholom; Indurkhya, Nitin; Zhang, Tong und Damerau, Fred (2005), Text Mining : Predictive Methods for Analyzing Text, Springer Verlag, New York, USA.
Ziegler, Cai (2006a), Apaches Lucene : eigene Suche und Indizierung, in: iX: Magazin für professionelle Informationstechnik, Nr. 6, Heise Verlag, Hannover, Deutschland, Seite 120-123.
Ziegler, Cai (2006b), Sentiment Detection : maschinelles Textverständnis, in: iX: Magazin für professionelle Informationstechnik, Nr. 10, Heise Verlag, Hannover, Deutschland, Seite 106-109.
Ziegler, Cai (2006c), Web 2.0 versus Semantic Web , In: iX: Magazin für professionelle Informationstechnik, Heise Verlag, Nr. 11, Hannover, Deutschland, Seite 54-59.
Frawley, W. J., Piatetsky-Shapiro, G., und Matheus, C. J. (1991), Knowledge discovery in database: An overview. In Knowledge Discovery in Databases, G. Piatetsky-Shapiro and W. J. Frawley, Eds. AAAI Press/MIT Press, Menlo Park, California, pp. 1-27.