Menu

lucene etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster
lucene etiketine sahip kayıtlar gösteriliyor. Tüm kayıtları göster

20 Kasım 2012 Salı

nutch content store

Merhaba, Apache Nutch kullanarak, web sitelerinizi crawl etmek istediginizde, default olarak crawl ederken html icerigini crawl edip indexlemez, bunun icin asagidaki satiri duzeltmemiz isimizi gorecektir.

Mesala ben solr`a indexledigim icin (solr 4.0)

../solr/example/solr/collection1/conf/schema.xml icerisinde asagidaki stored kismini true yapiyoruz
true
field name="content" type="string" stored="true" indexed="true"/

org.apache.solr.common.SolrException: undefined field text

Exception: 
org.apache.solr.common.SolrException: undefined field text 

Solution: 
1. open solrconfig.xml 
2. find
3. under that tag, find  text

4. change "text" to whatever your entity property that you need it to be indexed

For example, if I have an entity called car, it might have a property called brand and I might want to search within that field. So, in that case it would be convenient for me to change "text" to "brand"