nutch content store
Merhaba, Apache Nutch kullanarak, web sitelerinizi crawl etmek istediginizde, default olarak crawl ederken html icerigini crawl edip indexlemez, bunun icin asagidaki satiri duzeltmemiz isimizi gorecektir.
Mesala ben solr`a indexledigim icin (solr 4.0)
../solr/example/solr/collection1/conf/schema.xml icerisinde asagidaki stored kismini true yapiyoruz
true
field name="content" type="string" stored="true" indexed="true"/
golden goose francy
YanıtlaSiljordan shoes
yeezy 500
jordan shoes
yeezy shoes
vans outlet
nike max shoes
balenciaga
jordan shoes
yeezy boost 350 v2
xiaofang20191220