<?xml version="1.0" encoding="utf-8" ?>

<rss version="2.0" 
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
   xmlns:admin="http://webns.net/mvcb/"
   xmlns:dc="http://purl.org/dc/elements/1.1/"
   xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
   xmlns:wfw="http://wellformedweb.org/CommentAPI/"
   xmlns:content="http://purl.org/rss/1.0/modules/content/"
   >
<channel>
    <title>flawed concepts - studies</title>
    <link>http://blog.florianlaws.de/</link>
    <description></description>
    <dc:language>de</dc:language>
    <generator>Serendipity 1.2-beta2 - http://www.s9y.org/</generator>
    <pubDate>Thu, 05 Jun 2008 20:36:54 GMT</pubDate>

    <image>
        <url>http://blog.florianlaws.de/templates/default/img/s9y_banner_small.png</url>
        <title>RSS: flawed concepts - studies - </title>
        <link>http://blog.florianlaws.de/</link>
        <width>100</width>
        <height>21</height>
    </image>

<item>
    <title>A Literature Survey on Domain Adaptation of Statistical Classifiers</title>
    <link>http://blog.florianlaws.de/archives/201-A-Literature-Survey-on-Domain-Adaptation-of-Statistical-Classifiers.html</link>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/201-A-Literature-Survey-on-Domain-Adaptation-of-Statistical-Classifiers.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=201</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=201</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Domain Adaptation (i.e.: you train a statistical classifier on one type of text but want to use it on a different type of text) is one of my research interests.&lt;br /&gt;
&lt;br /&gt;
Recently I found a great survey of publications on domain adaptation:&lt;br /&gt;
&lt;a href=&quot;http://sifaka.cs.uiuc.edu/jiang4/domain_adaptation/survey/da_survey.html&quot;&gt;A Literature Survey on Domain Adaptation of Statistical Classifiers&lt;/a&gt;,&lt;br /&gt;
by &lt;a href=&quot;http://sifaka.cs.uiuc.edu/jiang4/&quot;&gt;Jing Jiang&lt;/a&gt;, who is a PhD candidate at UIUC and has written some interesting papers on domain adaptation herself, such as &lt;br /&gt;
&lt;a href=&quot;http://acl.ldc.upenn.edu/P/P07/P07-1034.pdf&quot;&gt;Instance weighting for domain adaptation in NLP.&lt;/a&gt; 
    </content:encoded>

    <pubDate>Thu, 05 Jun 2008 22:36:54 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/201-guid.html</guid>
    
</item>
<item>
    <title>Nachtrag zum Vortrag &quot;Sprache und Verbrechen&quot;</title>
    <link>http://blog.florianlaws.de/archives/178-Nachtrag-zum-Vortrag-Sprache-und-Verbrechen.html</link>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/178-Nachtrag-zum-Vortrag-Sprache-und-Verbrechen.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=178</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=178</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Ein Nachtrag zum Vortrag &lt;a href=&quot;http://www.uni-stuttgart.de/linguistik/jdg/details.html&quot;&gt;&quot;Sprache und Verbrechen&quot;&lt;/a&gt; von Sabine Ehrhardt, bei dem es darum ging, wie das BKA anhand der Sprache von z.B. Bekennerschreiben, Erpresserbriefen usw. versucht,. Informationen über den Täter abzuleiten.&lt;br /&gt;
&lt;br /&gt;
Dabei kam auch die Frage nach statistischen Methoden auf, und dazu habe ich gerade einen Link gefunden: &lt;br /&gt;
Koppel, Schler &amp;amp; Zigdon &lt;a href=&quot;http://doi.acm.org/10.1145/1081870.1081947&quot;&gt;Determining an author&#039;s native language by mining a text for errors&lt;/a&gt; (KDD2005)&lt;br /&gt;
(&lt;a href=&quot;http://www.cs.biu.ac.il/~schlerj/schler_kdd05.pdf&quot;&gt;Link&lt;/a&gt; für Leute ohne ACM-Zugang)&lt;br /&gt;
&lt;br /&gt;
(mehr davon bei &lt;a href=&quot;http://scholar.google.de/scholar?q=Determining+an+author%27s+native+language+by+mining+a+text+for+errors&amp;hl=en&amp;lr=&amp;btnG=Search&quot;&gt;Google Scholar&lt;/a&gt;) 
    </content:encoded>

    <pubDate>Thu, 24 May 2007 17:44:32 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/178-guid.html</guid>
    
</item>
<item>
    <title>Links (papers) of the day</title>
    <link>http://blog.florianlaws.de/archives/177-Links-papers-of-the-day.html</link>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/177-Links-papers-of-the-day.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=177</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=177</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Intelligent email clients:&lt;br /&gt;
&lt;br /&gt;
Dredze et. al.: &lt;a href=&quot;http://www.seas.upenn.edu/~mdredze/publications/transfer_nescai_06.pdf&quot;&gt;Feature Design for Transfer Learning&lt;/a&gt;&lt;br /&gt;
(learning to recognize mails that need a reply)&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Neustaedter et.al.: &lt;a href=&quot;http://www.ceas.cc/papers-2005/149.pdf&quot;&gt;The Social Network and Relationship Finder:&lt;br /&gt;
Social Sorting for Email Triage&lt;/a&gt;&lt;br /&gt;
&lt;br /&gt;
Boone: &lt;a href=&quot;http://www.cc.gatech.edu/classes/AY2003/cs8802b_spring/Email_Agent.pdf&quot;&gt;Concept Features in Re:Agent, an Intelligent Email Agent&lt;/a&gt;&lt;br /&gt;
&lt;br /&gt;
(there&#039;s a lot more, these are just the ones I stumbled upon.)&lt;br /&gt;
&lt;br /&gt;
I wonder why machine learning features don&#039;t play any role in real-world email clients apart from spam classification. 
    </content:encoded>

    <pubDate>Thu, 24 May 2007 11:58:12 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/177-guid.html</guid>
    
</item>
<item>
    <title>Links of the day</title>
    <link>http://blog.florianlaws.de/archives/176-Links-of-the-day.html</link>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/176-Links-of-the-day.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=176</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=176</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    &lt;a href=&quot;http://earningmyturns.blogspot.com/2007/05/zellig-harris-natural-language.html&quot;&gt;Fernando Pereira: &quot;Zellig Harris, natural language processing, and search&quot;&lt;/a&gt; &lt;br /&gt;
(about the differences between general language and technical languages and their implications for NLP)&lt;br /&gt;
&lt;br /&gt;
&lt;a href=&quot;http://www.regdeveloper.co.uk/2007/05/15/google_translation/page2.html&quot;&gt;Bill Softky: &quot;How Google translates without understanding&quot;&lt;/a&gt; &lt;br /&gt;
(elReg article about Google&#039;s effort in Statistical Machine Translation) 
    </content:encoded>

    <pubDate>Tue, 15 May 2007 22:40:07 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/176-guid.html</guid>
    
</item>
<item>
    <title>The Theory of the Wall Street Journal</title>
    <link>http://blog.florianlaws.de/archives/164-The-Theory-of-the-Wall-Street-Journal.html</link>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/164-The-Theory-of-the-Wall-Street-Journal.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=164</wfw:comment>

    <slash:comments>2</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=164</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    &quot;Computational linguistics in the lat 20 years essentially has been the Theory of the Wall Street Journal&quot;&lt;br /&gt;
Ron Kaplan (CTO &lt;a href=&quot;http://www.powerset.com&quot;&gt;Powerset&lt;/a&gt;), in a talk at &lt;a href=&quot;http://www.ims.uni-stuttgart.de&quot;&gt;IMS Stuttgart&lt;/a&gt; this afternoon. &lt;br /&gt;&lt;a href=&quot;http://blog.florianlaws.de/archives/164-The-Theory-of-the-Wall-Street-Journal.html#extended&quot;&gt;&quot;The Theory of the Wall Street Journal&quot; vollständig lesen&lt;/a&gt;
    </content:encoded>

    <pubDate>Thu, 15 Mar 2007 23:55:00 +0100</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/164-guid.html</guid>
    
</item>
<item>
    <title>Fernando Pereira bloggt</title>
    <link>http://blog.florianlaws.de/archives/158-Fernando-Pereira-bloggt.html</link>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/158-Fernando-Pereira-bloggt.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=158</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=158</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Gerade via &lt;a href=&quot;http://www.alias-i.com/blog&quot;&gt;Alias-I&lt;/a&gt; entdeckt: &lt;br /&gt;
&lt;a href=&quot;http://www.cis.upenn.edu/~pereira/&quot;&gt;Fernando Pereira&lt;/a&gt;, ein renommierter Forscher auf dem Gebiet von Computerlinguistik und Maschinellen Lernen an der &lt;a href=&quot;http://www.upenn.edu/&quot;&gt;University of Pennsylvania&lt;/a&gt; hat auch ein sehr lesenswertes &lt;a href=&quot;http://earningmyturns.blogspot.com/index.html&quot;&gt;Blog&lt;/a&gt;. 
    </content:encoded>

    <pubDate>Tue, 13 Feb 2007 23:22:00 +0100</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/158-guid.html</guid>
    
</item>
<item>
    <title>UIMA integration for the Stanford Named Entity Recognizer</title>
    <link>http://blog.florianlaws.de/archives/143-UIMA-integration-for-the-Stanford-Named-Entity-Recognizer.html</link>
            <category>computing</category>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/143-UIMA-integration-for-the-Stanford-Named-Entity-Recognizer.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=143</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=143</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    The &lt;a href=&quot;http://nlp.stanford.edu/index.shtml&quot;&gt;Stanford NLP Group&lt;/a&gt; released a &lt;a href=&quot;http://nlp.stanford.edu/software/CRF-NER.shtml&quot;&gt;Named Entity Recognition software&lt;/a&gt;, based on Conditional Random Fields and implemented in Java.&lt;br /&gt;
&lt;br /&gt;
It is pretty fast and also acheives quite good performance with the included models.&lt;br /&gt;
&lt;br /&gt;
For integration into IBM&#039;s &lt;a href=&quot;http://www.alphaworks.ibm.com/tech/uima&quot;&gt;UIMA&lt;/a&gt; text analysis frameword, I have written an Analysis Engine component that wraps the Stanford NE Regonizer.&lt;br /&gt;
You can download it here: &lt;a href=&quot;http://www.florianlaws.de/software/stanford-ner-uima.zip&quot;&gt;stanford-ner-uima.zip&lt;/a&gt;&lt;br /&gt;
Just like the Recognizer itself it is licensed under the GPL.&lt;br /&gt;
&lt;br /&gt;
Please let me know if it is useful for you. 
    </content:encoded>

    <pubDate>Wed, 22 Nov 2006 16:11:00 +0100</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/143-guid.html</guid>
    <category>ner</category>
<category>stanford</category>
<category>uima</category>
<category>ner</category>
<category>stanford</category>
<category>uima</category>

</item>
<item>
    <title>Schneefräsen-Algorithmus</title>
    <link>http://blog.florianlaws.de/archives/139-Schneefraesen-Algorithmus.html</link>
            <category>german</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/139-Schneefraesen-Algorithmus.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=139</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=139</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Noch schneit es nicht, aber man kann diesen Algorithmus auch auf Laubgebläse anwenden: Ein Algorithmus, wie man effizient eine Fläche mit einer Schneefräse vom Schnee befreit. Mit &lt;a href=&quot;http://www.ams.sunysb.edu/%7Ekotya/pages/SBPslidesDagstuhl.pdf&quot;&gt;lustigen Folien&lt;/a&gt;.&lt;br /&gt;
&lt;br /&gt;
(via &lt;a href=&quot;http://geomblog.blogspot.com/2006/11/snowblowing-or-leaf-raking-problem.html&quot;&gt;the Geomblog&lt;/a&gt;) 
    </content:encoded>

    <pubDate>Tue, 07 Nov 2006 10:38:19 +0100</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/139-guid.html</guid>
    
</item>
<item>
    <title>Auch Sprachsynthese braucht professionelle Sprecher</title>
    <link>http://blog.florianlaws.de/archives/132-Auch-Sprachsynthese-braucht-professionelle-Sprecher.html</link>
            <category>german</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/132-Auch-Sprachsynthese-braucht-professionelle-Sprecher.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=132</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=132</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    &lt;a href=&quot;http://blogs.msdn.com/spokenword/archive/2006/10/27/the-voices-behind-the-machine.aspx&quot;&gt;Stephen Potter&lt;/a&gt; berichtet über einen &lt;a href=&quot;http://www.ajc.com/services/content/business/stories/2006/10/27/1028bizvoices.html?cxtype=rss&amp;cxsvc=7&amp;cxcat=6&quot;&gt;Artikel&lt;/a&gt;, in dem über eine Firma berichtet wird, die professionelle Sprecher für Sprachcomputer vermittelt, so daß auch die eines Sprachcomputersystems das gewünschte Image vermittelt.&lt;br /&gt;
&lt;br /&gt;
Das sind &quot;klassische&quot; Sprachcomputer-Systeme, in denen die Sprachausgaben als ganze Sätze vorliegen (&quot;Canned Speech&quot; Systeme), und in dem Artikel wird auch die Frage aufgeworfen, ob professionelle Sprecher bei einem Fortschreiten der &lt;a href=&quot;http://de.wikipedia.org/wiki/Sprachsynthese&quot;&gt;Sprachsynthese&lt;/a&gt;-Technologie (Text-to-Speech, TTS) überflüssig werden.&lt;br /&gt;
&lt;br /&gt;
Ich denke, das wird so schnell nicht passieren, da gängige Text-to-Speech-Systeme ihre Äusserungen aus kleinen Stückchen (von einzelnen Lauten bis ganzen Wörtern) von Sprachaufnahmen menschlicher Sprecher zusammengesetzen (&lt;a href=&quot;http://www.ims.uni-stuttgart.de/phonetik/unitselection/demo2/&quot;&gt;Unit-Selection-Synthese&lt;/a&gt;). Die Stückchen werden natürlich angepasst und digital gefiltert und bearbeitet, dass man keine Knackser hört und auch die Intonation von Wörtern und Sätzen stimmt, aber das Grundmaterial ist Sprache von richtigen Menschen.&lt;br /&gt;
&lt;br /&gt;
Deswegen brauchen auch die Entwickler von Text-to-Speech-Systemen professionelle Sprecher für ihre  Bausteine. Ich denke auch, dass man die Stimme des Sprechers auch wiedererkennen kann, so dass die Eigenschaften einer Stimme, die für ein Image relevant sind, auch in einem TTS-Systemen durch die Auswahl des Sprechers kommen.&lt;br /&gt;
&lt;br /&gt;
Vollsynthetische Sprache hört sich immer noch katastrophal an, und weil die Forschung sich auf die oben beschriebene konkatenative Synthese konzentriert, wird das auch noch sehr lange so bleiben.&lt;br /&gt;
&lt;br /&gt;
Deshalb braucht man auch dann, wenn sich Sprachsynthese für Sprachanwendungen durchsetzt, immer noch professionelle Sprecher.&lt;br /&gt;
&lt;br /&gt;
 
    </content:encoded>

    <pubDate>Sat, 28 Oct 2006 18:44:57 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/132-guid.html</guid>
    <category>speech</category>
<category>speech</category>

</item>
<item>
    <title>Information Food Chain</title>
    <link>http://blog.florianlaws.de/archives/127-Information-Food-Chain.html</link>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/127-Information-Food-Chain.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=127</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=127</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    &lt;a href=&quot;http://citeseer.ist.psu.edu/etzioni96moving.html&quot;&gt;Etzioni (1996!)&lt;/a&gt;: &quot;I view the World Wide Web as an information food chain. The maze of pages and hyperlinks that comprise the Web are at the very bottom of the chain. The WebCrawlers and Alta Vistas of the world are information herbivores; they graze on Web pages and regurgitate them as searchable indices. Today, most Web users feed near the bottom of the information food chain, but the time is ripe to move up. Since 1991, we have been building information carnivores, which intelligently hunt and feast in Unix, on the Internet, and on the  Web&quot;.&lt;br /&gt;
&lt;br /&gt;
Nice metaphor. &lt;br /&gt;
(Save for the &quot;bots&quot; and &quot;agents&quot; rhethoric that follows.)&lt;br /&gt;
&lt;br /&gt;
Etzioni is building &quot;&lt;a href=&quot;http://citeseer.ist.psu.edu/697784.html&quot;&gt;information omnivores&lt;/a&gt;&quot; now. 
    </content:encoded>

    <pubDate>Tue, 26 Sep 2006 11:30:09 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/127-guid.html</guid>
    
</item>
<item>
    <title>So called &quot;language-independent&quot;</title>
    <link>http://blog.florianlaws.de/archives/116-So-called-language-independent.html</link>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/116-So-called-language-independent.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=116</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=116</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Is it just me or does the term &quot;language-independent&quot; (Named Entity Recognition, oder whatever) seem a bit pompus? When in fact all papers I&#039;ve seen on the subject instead suggest ways to train &lt;i&gt;multiple single-language&lt;/i&gt; classifiers - provided that you&#039;ve got corpora for all languages and even genres. 
    </content:encoded>

    <pubDate>Tue, 15 Aug 2006 14:31:16 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/116-guid.html</guid>
    <category>ner</category>
<category>ner</category>

</item>
<item>
    <title>Gestatten: Erkan</title>
    <link>http://blog.florianlaws.de/archives/111-Gestatten-Erkan.html</link>
            <category>german</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/111-Gestatten-Erkan.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=111</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=111</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Die Firma ATIP baut das Sprachsynthesesystem &lt;a href=&quot;http://www.atip.de/german/technologie/tts/proseronline.htm&quot;&gt;Proser&lt;/a&gt;. Und dem hat sie auch eine deutsche Stimmt mit türkischem Akzent spendiert: &quot;Erkan&quot;. Es gibt eine Web-Demo, und die Synthesequalität ist gar nicht mal schlecht.&lt;br /&gt;
&lt;br /&gt;
(Gefunden über eine Seite mit einer &lt;a href=&quot;http://ttssamples.syntheticspeech.de/deutsch/index.html&quot;&gt;Übersicht deutschprachiger Sprachsynthesesysteme&lt;/a&gt;) 
    </content:encoded>

    <pubDate>Wed, 28 Jun 2006 00:10:37 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/111-guid.html</guid>
    
</item>
<item>
    <title>Jetzt gehts loohoos!</title>
    <link>http://blog.florianlaws.de/archives/107-Jetzt-gehts-loohoos!.html</link>
            <category>german</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/107-Jetzt-gehts-loohoos!.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=107</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=107</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    Nicht nur mit Fußball, wo &quot;wir&quot; natürlich Weltmeister werden, aber das hat ja schon begonnen, sondern auch mit der letzten Phase meines Studiums.&lt;br /&gt;
Letzte Woche habe ich meine letzte Prüfung abgelegt, und gestern ist der Startschuss für meine Diplomarbeit gefallen. Es wird um &lt;a href=&quot;http://en.wikipedia.org/wiki/Named_entity_recognition&quot;&gt;Named Entity Recognition&lt;/a&gt;, also die Erkennung von Eigennamen in natürlichsprachigen Texten gehen, und das ganze soll in UIMA, einem Framework von IBM für &lt;a href=&quot;http://en.wikipedia.org/wiki/Information_extraction&quot;&gt;Information Extraction&lt;/a&gt; implementiert werden. 
    </content:encoded>

    <pubDate>Wed, 21 Jun 2006 16:49:22 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/107-guid.html</guid>
    
</item>
<item>
    <title>Clustering Musings #2</title>
    <link>http://blog.florianlaws.de/archives/98-Clustering-Musings-2.html</link>
            <category>english</category>
            <category>studies</category>
    
    <comments>http://blog.florianlaws.de/archives/98-Clustering-Musings-2.html#comments</comments>
    <wfw:comment>http://blog.florianlaws.de/wfwcomment.php?cid=98</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://blog.florianlaws.de/rss.php?version=2.0&amp;type=comments&amp;cid=98</wfw:commentRss>
    

    <author>nospam@example.com (florian)</author>
    <content:encoded>
    &lt;blockquote&gt;&quot;The matter of knowing when to stop in hierarchical agglomerativ clustering has been explored, but not resolved.&quot;[1]&lt;/blockquote&gt;&lt;br /&gt;
That sums up my current problems pretty well.&lt;br /&gt;
&lt;br /&gt;
[1] D. Beeferman , A. Berger: &quot;Agglomerative clustering of a search engine query log&quot;. Proc. of the 6th ACM SIGKDD conference, 2000 
    </content:encoded>

    <pubDate>Sun, 09 Apr 2006 14:23:16 +0200</pubDate>
    <guid isPermaLink="false">http://blog.florianlaws.de/archives/98-guid.html</guid>
    <category>clustering</category>
<category>clustering</category>

</item>

</channel>
</rss>
