PUT japan_corporate_search/_mapping
{
"properties": {
"法人名": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"法人名ふりがな": {
"type": "keyword",
"fields": {
"text": {
"type": "text",
"analyzer": "kuromoji"
}
}
},
"法人名英語": {
"type": "text",
"analyzer": "english"
},
"事業概要": {
"type": "text",
"analyzer": "kuromoji"
},
"営業品目リスト": {
"type": "text",
"analyzer": "kuromoji"
},
"企業ホームページ": {
"type": "keyword"
},
"企業規模詳細": {
"properties": {
"女性": {"type":"long"},
"男性": {"type": "long"}
}
},
"創業年": {
"type": "long"
},
"従業員数": {
"type": "long"
},
"最終更新日": {
"type": "date"
},
"本社所在地": {
"type": "keyword"
},
"法人代表者名": {
"type": "keyword"
},
"法人代表者役職": {
"type": "keyword"
},
"法人番号": {
"type": "long"
},
"登記記録の閉鎖等の事由": {
"type": "keyword"
},
"登記記録の閉鎖等年月日": {
"type": "keyword"
},
"設立年月日": {
"type":"date"
},
"資本金": {
"type":"long"
},
"資格等級": {
"type":"keyword"
},
"郵便番号": {
"type":"keyword"
}
}
}
大規模CSVデータを効率的にElasticsearchにロードする
Elasticsearchは大規模データの高速検索に適した検索エンジンだが、大量のデータを投入する際には効率的な方法を選ぶ必要がある。本稿では、Pythonを用いて大規模なCSVファイルからElasticsearchにデータを効率的にロードする方法について解説する。 問題点…