長らく検証していなかった、Solr。前回は、ただインストールしただけで終わっていました。ryuchan.hatenablog.com
今回は、SQL Server のデータを Solr 側にインポートします。では、早速やってみましょう。まずは、JDBC ドライバーのダウンロード♪ここ数年間はすっかりマイクロソフトの人になってしまったので、JDBC という響きは8年ぶりです。あ、今回使用した環境は、SQL Server 2014 です。
- 下記のサイトから JDBC ドライバをダウンロードしましょう。
Download Microsoft JDBC Driver 4.1 for SQL Server と Microsoft JDBC Driver 4.0 for SQL Server from Official Microsoft Download Center
- sqljdbc41.jar を 【インストールディレクトリ】\lib 配下にコピーしましょう。
- 【インストールディレクトリ】\solr\【コアディレクトリ】\conf 配下に移動します。
- conf\solrconfig.xml に下記の定義を追加します。
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <lst name="defaults"> <str name="config">data-config.xml</str> </lst> </requestHandler>
- conf\data-config.xml を作成し、ファイルの構成を下記のように変更します。今回使用するデータベースは、AdventureWorks2014、テーブルは、Production.ProductReviewです。
<?xml version="1.0" encoding="UTF-8" ?> <dataConfig> <dataSource driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" type="JdbcDataSource" url="jdbc:sqlserver://【サーバー名】\【インスタンス名】;databaseName=AdventureWorks2014;" user="sa" password="【パスワード】" /> <document> <entity name="ProductionEntity" query="SELECT * FROM Production.ProductReview"> <field column="ProductReviewID" name="ProductReviewID"/> <field column="Comments" name="Comments"/> </entity> </document> </dataConfig>
※注意:dataSource は datasource としないように注意しましょう。読み込んでくれませんので。私、これで検証のほとんどの時間を費やしました.....
- conf\schema.xml に下記の定義を追加します。
<field name="ProductReviewID" type="int" indexed="true" stored="true" required="true" multiValued="false" /> <field name="Comments" type="text_general" indexed="true" stored="true"/>
これで設定は完了です。早速、インデックスを作成してみましょう。手順は下記の通りです。
- Core Selecttor から今回設定したものを選択します。
- Dataimport をクリックします。
- Execute をクリックします。成功すると右上の赤枠のように表示されます。
これで、インデックスを作成することができました。うーん、まだまだ調査しなければ、いけないこといっぱいありますね。
お、JSON でいいことできそう。REST な API で色々できそう。REST な感じは面白いですもんね。
あ、レプリケーションも組めそう。業務で利用しようと思ったら、必須ですもんね。
ん、delta-import。差分取り込みですね。業務で利用しようと思ったら、必須ですもんね。
その3は何やろうかな。時間 or 気が向ければ その3で差分取り込みでもやってみます。
※Solr 勉強中....初心者ですが、まだ、本は買いません。ぐぐりじゃなくて、びんぐります!
[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン (Software Design plus)
- 作者: 大谷純,阿部慎一朗,大須賀稔,北野太郎,鈴木教嗣,平賀一昭,株式会社リクルートテクノロジーズ,株式会社ロンウイット
- 出版社/メーカー: 技術評論社
- 発売日: 2013/11/29
- メディア: 大型本
- この商品を含むブログ (7件) を見る
Apache Solr入門 ―オープンソース全文検索エンジン
- 作者: 関口宏司,三部靖夫,武田光平,中野猛,大谷純
- 出版社/メーカー: 技術評論社
- 発売日: 2010/02/20
- メディア: 大型本
- 購入: 18人 クリック: 567回
- この商品を含むブログ (22件) を見る