Wissensexploration.de Knowledge Mining & Discovery: Text, Web und Data Mining, Suchtechnologien, explorative Datenanalyse
| Web Crawling Strategien und Information Retrieval im Web, fokussierte Web Crawler, semantisches Wissen
und Informationsextraktion | > Empowering Business Intelligence.
Literatur Text Mining, Web Mining, Data Mining, Information Retrieval, Web Crawling
- Alpar, Paul und Niederreichholz, Joachim (2000), Data Mining im praktischen Einsatz: Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung, Vieweg Verlag, Wiesbaden, Deutschland.
- Arasu, Arvind; Cho, Junghoo; Garcia-Molina, Hector; Paepcke, Andreas und Raghavan, Sriram (2000), Searching the Web, Technical Report, Stanford University, USA, Online: http://dbpubs.stanford.edu/pub/showDoc.Fulltext ?lang=en&doc=2000-37&format=pdf&compression=&name=2000-37.pdf [20.11.2006]
- Baeza-Yates, Ricardo; Castillo, Carlos; Marin, Mauricio und Rodriguez, Andrea (2005), Crawling a country: better strategies than breadth-first for web page ordering, in: WWW '05: Special interest tracks and posters of the 14th international conference on World Wide Web, Chiba, Japan, Seiten 864-872.
- Baeza-Yates, Ricardo und Ribeiro-Neto, Berthier (1999), Modern Information Retrieval, Addison-Wesley Longman Publishing Co., Boston, MA, USA.
- Bergmark, Donna; Lagoze, Carl und Sbityakov, Alex (2002), Focused Crawls, Tunneling, and Digital Libraries, in: 6th European Conference on Digital Libraries 2002, Rom, Italien, Online: http://citeseer.ist.psu.edu/bergmark02focused.html [18.11.2006]
- Berners-Lee, Tim; Hendler, J. und Lassila, O. (2001), The semantic Web. Scientific American, 284(5), o.O., Online: http://wireless.ictp.trieste.it/school_2002/lectures/ canessa/0501berners-lee.ps [18.11.2006]
- Blumauer, Andreas; Pellegrini, Tassilo (2006). Semantic Web und semantische Technologien. Zentrale Begriffe und Unterscheidungen. In: Pellegrini, Tassilo; Blumauer, Andreas (Hg.): Semantic Web. Wege zur vernetzten Wissensgesellschaft. Berlin: Springer Verlag, S. 9 – 27
- Bra, Paul, De; Houben, Geert-Jan; Kornatzky, Yoram und Post, Reinier (1994), Information retrieval in the World-Wide Web: Making client-based searching feasible, Computer Networks and ISDN Systems 27 (2), Amsterdam, Niederlande, Seite 183-192, Online: http://citeseer.ist.psu.edu/debra94information.html [20.11.2006]
- Brin, Sergey und Page, Larry (1998), The Anatomy of a Large-Scale Hypertextual Web Search Engine, in: Computer Networks and ISDN Systems, Volume 30, Issues 1-7, Brisbane, Australien, Seite 107-117, Online: http://infolab.stanford.edu/~backrub/google.html [19.11.2006]
- Carstensen, Kai-Uwe; Ebert, Christian; Endriss, Cornelia; Jekat Susanne und Klabunde, Ralf (2004), Computerlinguistik und Sprachtechnologie. Eine Einführung, 2. Auflage, Spektrum Akademischer Verlag, Heidelberg, Deutschland.
- Chakrabarti, Soumen (2000), Data Mining for Hypertext: A Tutorial Survey, SIGKDD: SIGKDD Explorations: Newsletter of the Special Interest Group (SIG) on Knowledge Discovery & Data Mining, Volume 2, Issue 1, o.O., Seite 1-10.
- Chakrabarti, Soumen (2003), Mining the Web: Discovering Knowledge from Hypertext Data, Morgan-Kauffman, San Francisco, USA.
- Chakrabarti, Soumen; Berg, Martin, van den und Dom, Byron (1999), Focused crawling: a new approach to topic-specific Web resource discovery, in: Proceedings of 8th International World Wide Web Conference (WWW8), Toronto, Kanada, Seite 545-562, Online: http://www.cs.berkeley.edu/~soumen/doc/www1999f/pdf/www1999f.pdf [01.11.06]
- Chakrabarti Soumen; Punera, Kunal; Subramayam, Mallela (2002), Accelerated focused crawling through online relevance feedback, in: WWW2002: Proceedings of the eleventh international world wide web conference, Hawaii, USA, Online: http://www2002.org/CDROM/refereed/336/index.html [18.11.2006]
- Chau, Michael und Chen, Hsinchun (2003), Comparison of three vertical search spiders, in: Computer, Volume 36, Number 5, IEEE Computer Society Society, Los Alamitos, CA, USA, Seite 56-62.
- Couvering, Elizabeth, Van (2004), New Media? A Political Economy of Search Engines, Conference of the International Association of Media & Communications Researchers (IAMCR), Porto Alegre, Brasilien, Online: http://personal.lse.ac.uk/VANCOUVE/ IAMCR-CTP_SearchEnginePoliticalEconomy_EVC_2004-07-14.pdf [18.11.2006]
- Eikvil, Line (1999), Information Extraction from WWW – A Survey, Technical report 945, Norweigan Computing Center, Oslo, Norwegen.
- Ehrig, Marc; Hartmann, Jens und Schmitz, Christoph (2004), Ontologiebasiertes Web Mining, in: Informatik 2004: Informatik verbindet, Beiträge der 34. Jahrestagung der Gesellschaft für Informatik e.V., Köllen Druck+Verlag GmbH, Bonn, Deutschland, Seite 187 – 193, Online: http://www.uni-karlsruhe.de/WBS/meh/publications/ehrig04metis.pdf [01.11.2006]
- Ehrig, Marc und Maedchen, Alexander (2003), Ontology-focused crawling of Web documents, in: Proceedings of the 2003 ACM symposium on Applied computing, Melbourne, Florida, Online: http://www.aifb.uni-karlsruhe.de/WBS/meh/publications/ehrig03ontology.pdf [01.11.2006]
- Etzioni, Oren (1996), The World-Wide Web: Quagmire or Gold Mine?, Communications of the ACM, Vol. 39, No. 11, o.O., Seite 65-68.
- Fan, Weiguo; Wallace, Linda; Rich, Stephanie und Zhang, Zhongju (2005), Tapping into the power of text mining, Communications of ACM, Volume 49, Number 2, o.O., Seite 76-82, Online: http://pubs.dlib.vt.edu:9090/2/01/text_mining_final_preprint.pdf [19.11.06]
- Fayyad, Usama; Piatetsky-Shapiro, Gregory und Smyth Padhraic (1996), From Data Mining to Knowledge Discovery in Databases, AI Magazine, American Association for Artificial Intelligence, California, USA, Seite 37-54.
- Ferber, Reginald (2003), Information Retrieval: Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web, dpunkt.verlag, Heidelberg, Deutschland.
- Filliben, James (2004), NIST/SEMATECH e-Handbook of Statistical Methods, o.O., Online: http://www.itl.nist.gov/div898/handbook/eda/section1/eda11.htm [01.11.2006]
- Fürnkranz, Johannes (1999), Exploiting structural Information for Text Classification on the WWW, In: IDA '99: Proceedings of the 3rd Symposium on Intelligent Data Analysis, Amsterdam, Holland, Seite 487-498.
- Gao, Li; Chang, Elizabeth und Han, Song (2005), Powerful Tool to Expand Business Intelligence:Text Mining, In: Enformatika Volume 8, Budapest, Ungarn, S. 110-116, Online: http://www.enformatika.org/data/v8/v8-20.pdf [01.11.06]
- Glover, Eric J.; Tsioutsiouliklis, Kostas; Lawrence, Steve; Pennock, David M.; Flake, Gary W. (2002), Using Web Structure for Classifying and Describing Web Pages, In: Proceedings of the 11th international conference on World Wide Web, Honolulu, Hawaii, USA, Online: http://citeseer.comp.nus.edu.sg/603741.html [19.11.2006]
- Görz, G.; Rollinger, C. und Schneeberger, J. (2000), Einführung in die künstliche Intelligenz, Oldenbourg Verlag, München, Deutschland, Online: http://www-ai.cs.uni-dortmund.de/lehre/vorlesungen/mlrn/skript/handbuch_ki-ml.pdf [01.11.06]
- Cunningham, Hamish (2005), Information Extraction, Automatic, in: Encyclopedia of Language and Linguistics, 2nd Edition, Elsevier, Oxford, Großbritannien, Online: http://gate.ac.uk/sale/ell2/ie/main.pdf [19.11.06]
- Hersovici, Michael; Jacovi, Michal; Maarek, Yoelle S.; Pelleg, Dan; Shtalhaim, Menanchem; und Ur, Sigalit (1998), The shark-search algorithm. An application: tailored Web site mapping, In: Proceedings of the seventh international conference on World Wide Web 7, Brisbane, Australien, S. 317-326, Online: http://www.cs.cmu.edu/~dpelleg/bin/360.html [20.11.2006]
- Hippner, Hajo; Merzenich, Melanine und Wilde, Klaus D. (2002), Der Prozess des Data Mining im Marketing, In: Klaus D. Wilde, Hajo Hippner, Melanie Merzenich (Herausgeber), Data Mining: Mehr Gewinn aus Ihren Kundendaten, Verlagsgruppe Handelsblatt, Düsseldorf, Deutschland, Seite 9-53.
- Hippner, Hajo und Rentzmann, René (2006), Text Mining, In: Informatik Spektrum, Volume 29, Nr. 4, Sprinter Verlag, Heidelberg, Deutschland, Seite 287-290.
- Wilde, Klaus; Hippner, Hajo und Merzenich, Melanine (2002), Data Mining: Mehr Gewinn aus Ihren Kundendaten, Verlagsgruppe Handelsblatt, Düsseldorf, Deutschland.
- Keim, Daniel A. (2002), Datenvisualisierung und Data Mining, In: Datenbank-Spektrum – Zeitschrift für Datenbanktechnologie und Information Retrieval, Nr. 2/2002, dpunkt Verlag, Heidelberg, Deutschland, Seite 30-39.
- Kleinberg, Jon (1998), Authoritative sources in a hyperlinked environment, In: Proceedings of the Nineth Annual ACM-SIAM Symposium on Discrete Algorithms, Volume 15, o.O., 1998, Online: http://www.cs.cornell.edu/home/kleinber/auth.pdf [10.11.2006]
- Kosala, Raymond und Blockeel, Hendrik (2000), Web Mining Research: A Survey, SIGKDD Explorations: Newsletter of the Special Interest Group (SIG) on Knowledge Discovery & Data Mining, ACM, Volume 2, Issue 1, o.O., Seite 1-10, Online: http://www.acm.org/sigs/sigkdd/explorations/issues/2-1-2000-06/kosala.pdf [01.11.06]
- Lewandowski, Dirk (2005), Web Information Retrieval: Technologien zur Informationssuche im Internet, DGI-Schrift (Informationswissenschaft 7), Dinges & Frick GmbH, Frankfurt am Main, Deutschland.
- Lewandowski, Dirk (2006), Aktualität als erfolgskritischer Faktor bei Suchmaschinen, in: IWP - Information: Wissenschaft und Praxis 56(2005)1, Frankfurt am Main, Deutschland, Seite 141-148.
- Loh, Stanley; Krug Wives, Leandro; Oliveira, José Palazzo, de (2000), Concept-Based Knowledge Discovery in Texts Extracted from the Web, SIGKDD Explorations, Volume 2, Issue 1, o.O., S. 29-39.
- Mayr, Philipp und Tosques, Fabio (2005), Webometrische Analysen mit Hilfe der Google Web APIs in Information: Wissenschaft und Praxis 56(1), Frankfurt am Main, Deutschland, Online: http://eprints.rclis.org/archive/00003143/01/Mayr_Tosques_IWP05.pdf [08.08.2007]
- McCallum, Andrew (2005), Information Extraction: Distilling Structured Data from unstructured Text, ACM Queue, Volume 3, Issue 9, New York, USA.
- Mehler, Alexander und Wolff, Christian (2005), Einleitung: Perspektiven und Positionen des Text Mining, In: Zeitschrift für Computerlinguistik und Sprachtechnologie, Band 20, Heft 1, Seite 1-18, Regensburg, Deutschland.
- Neumann, Günter (2001), Informationsextraktion, in: Computerlinguistik und Sprachtechnologie – Eine Einführung, Spektrum Akademischer Verlag, Berlin, Deutschland, Seite 448-516.
- Novak, Blaž (2004), A survey of focused web crawling algorithms, 7th International Multiconference on Information Society IS'04, Ljubljana, Slovenija. Online: http://kt.ijs.si/Dunja/SiKDD2004/Papers/BlazNovak-FocusedCrawling.pdf [10.11.2006]
- o.V. (2001), NStein Technology Whitepaper, Quebec, Kanada, Online: info@nstein.com [08.08.2006]
- o.V. (2006a), Online search hits all-time high of 5.7 billion searches, rising 39 percent year-over-year in January 2006, according to Nielsen//Netratings, Nielsen//Netratings, o.O., Online: http://www.nielsen-netratings.com/pr/pr_060302.pdf [19.11.2006]
- o.V. techterms.org (2006b), Plain Text, Online:http://www.techterms.org/definition/plaintext [20.11.2006]
- O’Reilly, Tim (2005), What is Web 2.0: Design Patterns and Business Models for the Next Generation of Software, Online: http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html [20.11.2006]
- Page, Lawrence; Brin, Sergey; Motwani, Rajeev und Winograd, Terry (1998), The pagerank citation ranking: Bringing order to the web, Technical report, Computer Science Department, Stanford University, USA.
- Qin, Jialun; Zhou, Yilu und Chau, Michael (2004), Building Domain-Specific Web Collections for Scientific Digital Libraries: A Meta-Search Enhanced Focused Crawling Method, In: JCDL '04: Proceedings of the 4th ACM/IEEE-CS joint conference on Digital libraries, New York, NY, USA, Seite 135-141.
- Rajman, M. und Besanon, R. (1997), Text Mining: Natural Language Techniques and Text Mining Applications, in: Proceedings of the seventh IFIP 2.6 Working Conference on Database Semantics (DS-7), Chapam & Hall IFIP Proceedings series, Leysin, Switzerland, Online: http://citeseer.ist.psu.edu/rajman97text.html [07.11.06]
- Mooney, Raymond und Nahm, Yong (2003), Multilingualism and Electronic Language Management: Proceedings of the 4th International MIDP Colloquium, Van Schaik Pub., Bloemfontein, Südafrika, Seite 141-160.
- Sizov, Sergej; Biwer, Michael; Graupmann, Jens; Siersdorfer, Stefan; Theobald, Martin; Weikum, Gerhard und Zimmer, Patrick (2003), The BINGO! System for Information Portal Generation and Expert Web Search, The 1st Semiannual Conference on Innovative Data Systems Research (CIDR), Asilomar(CA), Online: http://www-db.cs.wisc.edu/cidr/cidr2003/program/p7.pdf [10.11.2006]
- Subramanian, Arumugam (2005), Classification Techniques for Categorization of Hypertext Documents, Report, University of Florida, USA, Online: http://www.cise.ufl.edu/~sa2/pubs/datamining.pdf [01.10.06]
- Sullivan, Dan (2001), Document Warehousing and Text Mining: Techniques for Improving Business Operations, Marketing, and Sales, John Wiley & Sons, New York, USA.
- Sun, Aixin; Lim, Ee-Peng und Ng, Wee-Keong (2002), Web classification using support vector machine, In: WIDM '02: Proceedings of the 4th international workshop on Web information and data management, McLean, Virginia, USA, Seiten 96-99.
- Spiliopoulou, Myra und Winkler, Karsten, (2002), Text Mining auf Handelsregistereinträgen: Der SAS Enterprise Miner im Einsatz, in: Wilde, Klaus; Hippner, Hajo und Merzenich, Melanine (Herausgeber), Data Mining: Mehr Gewinn aus Ihren Kundendaten, Verlagsgruppe Handelsblatt, Düsseldorf, Deutschland, Seite 117-124.
- Ullrich, Mike; Maier, Andreas und Angele, Jürgen (2003), Taxonomie, Thesaurus, Topic Map, Ontologie – ein Vergleich, ontoprise Whitepaper Series, Karlsruhe, Deutschland, Online: http://www.ontoprise.de/content/e1276/e1358/e1362/TaxonomieThesaurusTopicMapOntologiev13_ger.pdf [01.11.06]
- Weiss, Scholom; Indurkhya, Nitin; Zhang, Tong und Damerau, Fred (2005), Text Mining: Predictive Methods for Analyzing Text, Springer Verlag, New York, USA.
- Ziegler, Cai (2006a), Apaches Lucene: eigene Suche und Indizierung, in: iX: Magazin für professionelle Informationstechnik, Nr. 6, Heise Verlag, Hannover, Deutschland, Seite 120-123.
- Ziegler, Cai (2006b), Sentiment Detection: maschinelles Textverständnis, in: iX: Magazin für professionelle Informationstechnik, Nr. 10, Heise Verlag, Hannover, Deutschland, Seite 106-109.
- Ziegler, Cai (2006c), Web 2.0 versus Semantic Web, In: iX: Magazin für professionelle Informationstechnik, Heise Verlag, Nr. 11, Hannover, Deutschland, Seite 54-59.
- Frawley, W. J., Piatetsky-Shapiro, G., und Matheus, C. J. (1991), Knowledge discovery in database: An overview. In Knowledge Discovery in Databases, G. Piatetsky-Shapiro and W. J. Frawley, Eds. AAAI Press/MIT Press, Menlo Park, California, pp. 1-27.