都内で働くSEの技術的なひとりごと / Technical soliloquy of System Engineer working in Tokyo

都内でサラリーマンやってます。SQL Server を中心とした (2023年からは Azure も。) マイクロソフト系(たまに、OSS系などマイクロソフト以外の技術も...)の技術的なことについて書いています。日々の仕事の中で、気になったことを技術要素関係なく気まぐれに選んでいるので記事内容は開発言語、インフラ等ばらばらです。なお、当ブログで発信、発言は私個人のものであり、所属する組織、企業、団体等とは何のかかわりもございません。ブログの内容もきちんと検証して使用してください。英語の勉強のため、英語の

土曜日の夜に仕事するのやだなぁと思って、気晴らしついてでに MSSQL Tiger Team の SQL Server 2017 Showplan enhancements を確認してみた

 SQL Server 2017 で実行プランの機能追加がありました。
blogs.msdn.microsoft.com

 早速、SQL Server 2017 で下記のクエリを実行してみましょう。

SELECT
    soh.*,
    sod.*
FROM
    Sales.SalesOrderHeader soh
    INNER JOIN
        Sales.SalesOrderDetail sod
    ON  sod.SalesOrderID = soh.SalesOrderID
WHERE
    CustomerID = 29565

f:id:koogucc11:20170513222920p:plain

 プリパティからオプティマイザが使用している統計の情報が参照できるようになっています。
f:id:koogucc11:20170513223300p:plain

<optimizerstatsusage>
    <statisticsinfo database="[AdventureWorks]" schema="[Sales]" table="[SalesOrderHeader]" statistics="[PK_SalesOrderHeader_SalesOrderID]" modificationcount="0" samplingpercent="100" la14-07-17t16:11:30.67="La14-07-17T16:11:30.67">
    </statisticsinfo>
    <statisticsinfo database="[AdventureWorks]" schema="[Sales]" table="[SalesOrderDetail]" statistics="[_WA_Sys_00000002_44CA3770]" modificationcount="0" samplingpercent="68.2155" lastu05-13t20:28:34.77="LastU05-13T20:28:34.77">
    </statisticsinfo>
    <statisticsinfo database="[AdventureWorks]" schema="[Sales]" table="[SalesOrderHeader]" statistics="[IX_SalesOrderHeader_CustomerID]" modificationcount="0" samplingpercent="100" last-07-17t16:11:32.41="Last-07-17T16:11:32.41">
    </statisticsinfo>
    <statisticsinfo database="[AdventureWorks]" schema="[Sales]" table="[SalesOrderDetail]" statistics="[PK_SalesOrderDetail_SalesOrderID_SalesOrderDetailID]" modificationcount="0" sampl67.8454="Sampl67.8454">
    </statisticsinfo>
</optimizerstatsusage>

 クエリが予想したパフォーマンスが出ていない、インデックスを使用していないときに統計情報の最終更新時間が古すぎるとか、サンプリングが低すぎるなどが起因していることはよくあることです。実行プランに使用統計の情報が出るだけでも、パフォーマン調査の効率が上がりそうですね。それ以外にも、CPU Time や WaitStats の情報も出力されます。
f:id:koogucc11:20170513224157p:plain

<waitstats>
    <wait waittype="PAGEIOLATCH_SH" waittimems="9" waitcount="26">
    </wait>
</waitstats>
<querytimestats cputime="2" elapsedtime="11">
</querytimestats>

 これは非常に助かる、いい機能追加ですね。

なんとなく、タバスコ全種類買ってみたくなった。

Resumable Online Index Rebuild is in public preview for SQL Server 2017 CTP 2.0 をお試してみた

 何か目に違和感 ( 痛いわけではない ) を感じてしまい、朝早く起きたので....記事書きます(笑)。

 CTP2.0 ( SQL Server 2017 ) で Resumable Online Index Rebuild という大規模データベースを運用する上で非常に便利な機能が搭載されました。
blogs.technet.microsoft.com

 Resumable Online Index Rebuild は下記のシナリオで使われることを想定しています。

 索引の再構築が失敗した後で、索引の再作成操作を再開することができます。これにより、大きな表のインデックスをリビルドするときに時間を削減することが可能ですね。

  • Resume an index rebuild operation after an index rebuild failure, such as after a database failover or after running out of disk space. There is no need to restart the operation from the beginning. This can save a significant amount of time when rebuilding indexes for large tables.

 進行中のインデックスリビルドを一時停止し、後で再開できます。リソースを大きく使用するバッチなどと競合しないように一時停止および再開ができますね。

  • Pause an ongoing index rebuild operation and resume it later. For example, you may need to temporarily free up system resources to execute a high priority task or you may have a single maintenance window that is too short to complete the operation for a large index. Instead of aborting the index rebuild process, you can pause the index rebuild operation and resume it later without losing prior progress.

 大量のログスペースを使用することなく、大規模なインデックスを再構築し、他のメンテナンス作業をブロックするロングトランザクションを使用します ( これいいのかな? )。これにより、ログの繰り越し、長時間実行されるインデックスリビルドでエラーを回避可能です。※うーん、このあたりはもっと調査する必要がありそうだなぁ。英語力がないだけなのか....

  • Rebuild large indexes without using a lot of log space and have a long-running transaction that blocks other maintenance activities. This helps log truncation and avoid out-of-log errors that are possible for long-running index rebuild operations.

 それでは、実際に試してみましょう。SQL Server 2017 向けの ALTER INDEX (Transact-SQL) | Microsoft Docs 構文を参照してみます。見慣れないオプションが増えてますね。

ALTER INDEX { index_name | ALL } ON <object>  
{  
      REBUILD {  
            [ PARTITION = ALL ] [ WITH ( <rebuild_index_option> [ ,...n ] ) ]   
          | [ PARTITION = partition_number [ WITH ( <single_partition_rebuild_index_option> ) [ ,...n ] ]  
      }  
    | DISABLE  
    | REORGANIZE  [ PARTITION = partition_number ] [ WITH ( <reorganize_option>  ) ]  
    | SET ( <set_index_option> [ ,...n ] )   
    | RESUME [WITH (<resumable_index_options>,[…n])]
    | PAUSE
    | ABORT
}  
[ ; ]  

<object> ::=   
{  
    [ database_name. [ schema_name ] . | schema_name. ]   
    table_or_view_name  
}  

<rebuild_index_option > ::=  
{  
      PAD_INDEX = { ON | OFF }  
    | FILLFACTOR = fillfactor   
    | SORT_IN_TEMPDB = { ON | OFF }  
    | IGNORE_DUP_KEY = { ON | OFF }  
    | STATISTICS_NORECOMPUTE = { ON | OFF }  
    | STATISTICS_INCREMENTAL = { ON | OFF }  
    | ONLINE = {   
          ON [ ( <low_priority_lock_wait> ) ]   
        | OFF } 
    | RESUMABLE = { ON | OFF } 
    | MAX_DURATION = <time> [MINUTES}     
    | ALLOW_ROW_LOCKS = { ON | OFF }  
    | ALLOW_PAGE_LOCKS = { ON | OFF }  
    | MAXDOP = max_degree_of_parallelism  
    | COMPRESSION_DELAY = {0 | delay [Minutes]}  
    | DATA_COMPRESSION = { NONE | ROW | PAGE | COLUMNSTORE | COLUMNSTORE_ARCHIVE }   
        [ ON PARTITIONS ( {<partition_number> [ TO <partition_number>] } [ , ...n ] ) ]  
}  

<single_partition_rebuild_index_option> ::=  
{  
      SORT_IN_TEMPDB = { ON | OFF }  
    | MAXDOP = max_degree_of_parallelism  
    | RESUMABLE = { ON | OFF } 
    | MAX_DURATION = <time> [MINUTES}     
    | DATA_COMPRESSION = { NONE | ROW | PAGE | COLUMNSTORE | COLUMNSTORE_ARCHIVE} }  
    | ONLINE = { ON [ ( <low_priority_lock_wait> ) ] | OFF }  
}  

<reorganize_option>::=  
{  
       LOB_COMPACTION = { ON | OFF }  
    |  COMPRESS_ALL_ROW_GROUPS =  { ON | OFF}  
}  

<set_index_option>::=  
{  
      ALLOW_ROW_LOCKS = { ON | OFF }  
    | ALLOW_PAGE_LOCKS = { ON | OFF }  
    | IGNORE_DUP_KEY = { ON | OFF }  
    | STATISTICS_NORECOMPUTE = { ON | OFF }  
    | COMPRESSION_DELAY= {0 | delay [Minutes]}  
}  

<resumable_index_option> ::=
 { 
    MAXDOP = max_degree_of_parallelism
    | MAX_DURATION =<time> [MINUTES]
    | <low_priority_lock_wait>  
 }

<low_priority_lock_wait>::=  
{  
    WAIT_AT_LOW_PRIORITY ( MAX_DURATION = <time> [ MINUTES ] ,   
                          ABORT_AFTER_WAIT = { NONE | SELF | BLOCKERS } )  
}  
Copy
Code
-- Syntax for SQL Data Warehouse and Parallel Data Warehouse  

ALTER INDEX { index_name | ALL }  
    ON   [ schema_name. ] table_name  
{  
      REBUILD {  
            [ PARTITION = ALL [ WITH ( <rebuild_index_option> ) ] ] 
          | [ PARTITION = partition_number [ WITH ( <single_partition_rebuild_index_option> )] ] 
      }  
    | DISABLE  
    | REORGANIZE [ PARTITION = partition_number ]  
}  
[;]  

<rebuild_index_option > ::=   
{  
    DATA_COMPRESSION = { COLUMNSTORE | COLUMNSTORE_ARCHIVE }
        [ ON PARTITIONS ( {<partition_number> [ TO <partition_number>] } [ , ...n ] ) ]   
}

<single_partition_rebuild_index_option > ::=   
{  
    DATA_COMPRESSION = { COLUMNSTORE | COLUMNSTORE_ARCHIVE }  
}

 それでは、インデックスリビルド中に一度処理を停止し、再開するまでの動作を確認してみましょう。下記のクエリは、インデックスリビルドが実行中であれば、停止するといったものです。Resumable Online Index Rebuild の状態を確認するには、sys.index_resumable_operations (Transact-SQL) | Microsoft Docsを使用します。

DECLARE @state INT
SET @state = 0

-- ステータスが 0 の間はループする。
WHILE (@state = 0) 
BEGIN
    -- 処理中のリビルド処理が存在したら、リビルド処理を PAUSE する。
    IF (SELECT Count(state) FROM sys.index_resumable_operations WHERE state = 0) > 0
    BEGIN
        -- 0.5 秒待機する。(すぐ PAUSE してしまうと、sys.index_resumable_operations 結果を見ても処理が進んでいる感を見ることができないため。)
        WAITFOR DELAY '00:00:00.500'
		-- インデックスリビルド処理を PAUSE する。
        ALTER INDEX PK_SalesOrderDetail_SalesOrderID_SalesOrderDetailID
        ON  Sales.SalesOrderDetail PAUSE;
		-- ステータスを 1 にし、ループを終了させる。
        SET @state = 1
    END
END

f:id:koogucc11:20170428074257p:plain

 次に、下記の DDL 文を SQL Server Management Studio で実行しましょう。実行後すぐに DDL の処理が停止されます。

ALTER INDEX PK_SalesOrderDetail_SalesOrderID_SalesOrderDetailID
ON  Sales.SalesOrderDetail REBUILD WITH(
        ONLINE = ON, MAXDOP = 1, RESUMABLE = ON, MAX_DURATION = 5
);

f:id:koogucc11:20170428074540p:plain

※RESUMABLE は REBUILD 処理を再開可能にするかのオプションです。ON の場合は、ONLINE = ON が必須となります。,  MAX_DURATION は REBUILD 処理を最大何分間実行するかを指定します。0 分より大きく、1 週間以下( 7 x 24 x 60 = 10080 分 )とする必要があります。上記の DDL 文の場合は、最大で リビルド処理を 5 分間実行し、完了しない場合は自動的に途中の状態で待機します。

 インデックスリビルド処理がどのような状態か確認します。下記のクエリを SQL Server Management Studio で実行しましょう。

SELECT  
    * 
FROM 
    sys.index_resumable_operations 

 先ほど実行した ALTER 文がサスペンドされているのが判断できます。
f:id:koogucc11:20170428074751p:plain

f:id:koogucc11:20170428074801p:plain

 再度、下記のクエリを実行させます。

DECLARE @state INT
SET @state = 0

-- ステータスが 0 の間はループする。
WHILE (@state = 0) 
BEGIN
    -- 処理中のリビルド処理が存在したら、リビルド処理を PAUSE する。
    IF (SELECT Count(state) FROM sys.index_resumable_operations WHERE state = 0) > 0
    BEGIN
        -- 0.5 秒待機する。(すぐ PAUSE してしまうと、sys.index_resumable_operations 結果を見ても処理が進んでいる感を見ることができないため。)
        WAITFOR DELAY '00:00:00.500'
		-- インデックスリビルド処理を PAUSE する。
        ALTER INDEX PK_SalesOrderDetail_SalesOrderID_SalesOrderDetailID
        ON  Sales.SalesOrderDetail PAUSE;
		-- ステータスを 1 にし、ループを終了させる。
        SET @state = 1
    END
END

f:id:koogucc11:20170428074917p:plain

 リビルド処理を再開させる場合は、下記のクエリを SQL Server Management Studio で実行します。

ALTER INDEX [PK_SalesOrderDetail_SalesOrderID_SalesOrderDetailID] 
ON [Sales].[SalesOrderDetail] RESUME WITH(MAXDOP = 4);

f:id:koogucc11:20170428075027p:plain

 上記の DDL 文の処理が中断されたら、下記のクエリを実行してみましょう。リビルドが停止され、MAXDOP が 1 → 4 に変更されたのことが判断できます。RESUME 時にもオプションが変更できることがわかりますね。

SELECT  
    * 
FROM 
    sys.index_resumable_operations 

f:id:koogucc11:20170428075124p:plain

 最後に下記のクエリを実行することで、リビルド処理を完了させることができます。

ALTER INDEX [PK_SalesOrderDetail_SalesOrderID_SalesOrderDetailID] 
ON [Sales].[SalesOrderDetail] RESUME;

f:id:koogucc11:20170428075221p:plain

 下記のクエリを SQL Server Management Studio で実行してみましょう。sys.index_resumable_operations に処理中のレコードも存在しないことが判断できますね。

SELECT  
    * 
FROM 
    sys.index_resumable_operations 

f:id:koogucc11:20170428075354p:plain

 インデックスリビルドの中断→再開時にオプションの変更→再度中断→再開までの動作が理解できたかと思います。今まで難しかった巨大なインデックスのリビルド運用も、Resumable Online Index の機能 ( RESUME,PAUSE および sys.index_resumable_operations ) をうまく使用することで運用も無理なく行うこと ( 朝になってもリビルドが終わってないとか... ) ができそうですね。個人的には Resumable Statistics Update みたいな機能もほしいです...

 アデノウィルスによる結膜炎はほぼ完治したようです。このような病気にならないように免疫力をあげないといけないですね。免疫力アップには...

 などがいいようです。もういい歳だし、考えないとなぁ。

Microsoft To-Do を使ってみた

 先週木曜日に発症したわけですが、右目は徐々に回復してきました。
ryuchan.hatenablog.com

 しかし、左目はまだまだ使いもになりません。どんなものなのか日本眼科学会のアデノウイルス結膜炎院内感染対策ガイドラインを参照しました。
日本眼科学会:アデノウイルス結膜炎院内感染対策ガイドライン

 たしかに、軽く考えてました。すいません。それ以外に病棟で感染患者が出た場合などの記載がありますが、その場合病院にとって危機的な状況になるんですね。勉強不足でした!

 アデノウイルスはよく知られた病原体であり、アデノウイルス結膜炎はありふれた疾患であるため軽視されがちであり、院内感染が発生して初めてことの重大さに気付いているのが現状である。

 さて、最近 Microsoft To-Do というツールがリリースされました。
f:id:koogucc11:20170422180518p:plain

 使用するにはマイクロソフトアカウントが必要です。
f:id:koogucc11:20170422180923p:plain

 マイクロソフトアカウントの ID を入力するとパスワードが求められます。
f:id:koogucc11:20170422181108p:plain

 2段階認証を設定していれば、承認が Microsoft Authenticator から要求されます。(もちろんマイクロソフトアカウントは2段階認証で保護してますよね?)
f:id:koogucc11:20170422181217p:plain
 
 Microsoft To-Do の初期画面が表示されます。
f:id:koogucc11:20170422181453p:plain
 
 To-Do のカテゴリなども設定できます。
f:id:koogucc11:20170422181812p:plain

 設定したカテゴリの画面です。
f:id:koogucc11:20170422181848p:plain

 背景画像も設定できます。お、シアトルのスペースニードルと Mt.Rainer ですね。
f:id:koogucc11:20170422182013p:plain

 それでは、早速 To-Do を設定します。プライベートのカテゴリを作成します。
f:id:koogucc11:20170422182235p:plain

 通院の To-Do を追加します。
f:id:koogucc11:20170422182247p:plain

 通院のアイテムをクリックします。
f:id:koogucc11:20170422182303p:plain

 日付を設定します。
f:id:koogucc11:20170422182317p:plain

 通知する日付および時間を設定します。
f:id:koogucc11:20170422182336p:plain

 通知する日付を設定します。
f:id:koogucc11:20170422182351p:plain

 通知する時間を設定します。
f:id:koogucc11:20170422182400p:plain

 これで設定が完了しました。
f:id:koogucc11:20170422182411p:plain

 まだまだ完治までには時間がかかりそうです。本日も通院しましたが、結膜炎に加えて偽膜が発生しており、それに伴い角膜炎まで併発していました(泣)。診察で一番嫌なのが偽膜除去です。偽膜を剥がすため、綿棒のようなもので眼球の表面をゴリゴリします。激痛すぎて叫びそうになります(´;ω;`)。結膜炎に罹って、あらためて目は大切しないといけないと強く思ったのでした。

 はやり目にはこの二つの市販薬がいいらしい。

【第2類医薬品】ロート抗菌目薬EX 10mL

【第2類医薬品】ロート抗菌目薬EX 10mL

【第2類医薬品】サンテ抗菌新目薬 12mL

【第2類医薬品】サンテ抗菌新目薬 12mL

 この辺の目薬を買ってみよう。

【第2類医薬品】サンテ ボーティエ 12mL

【第2類医薬品】サンテ ボーティエ 12mL

【第2類医薬品】サンテPC 12mL

【第2類医薬品】サンテPC 12mL

【第2類医薬品】サンテメディカル10 12mL

【第2類医薬品】サンテメディカル10 12mL

目が痛くて真夜中に起きてしまった...メール見てたら SQL Server 2017 Community Technology Preview 2.0 now available だったので、少し内容を見てみた

 次回リリースの SQL Server は、『 SQL Server 2017 』となりようです。
f:id:koogucc11:20170420031151p:plain

  • グラフデータの関係を保存および分析するためのサポート機能の追加
  • resumable online index rebuild の追加、再構築操作が一時停止された場所から再開することができる
  • Adaptive Query Processing の追加

We also added support for storing and analyzing graph data relationships. This includes full CRUD support to create nodes and edges and T-SQL query language extensions to provide multi-hop navigation using join-free pattern matching. In addition, SQL Server engine integration enables querying across SQL tables and graph data. And, you can use all of your existing SQL Server tools to work with graph data.

With resumable online index rebuild, you can resume a paused index rebuild operation from where the rebuild operation was paused rather than having to restart the operation at the beginning. Additionally, this feature rebuilds indexes using only a small amount of log space. This feature will help pick up right where you left off when an index maintenance job encounters issues, or allow you to split index rebuilds across maintenance windows.

New in SQL Server 2017, we’re adding the Adaptive Query Processing family of intelligent database features. These features automatically keep database queries running as efficiently as possible without requiring additional tuning from database administrators. In addition to the previous capability to adjust batch mode memory grants, in CTP 2.0 Adaptive Query Processing adds the batch mode adaptive joins and interleaved execution capabilities. Interleaved execution will improve the performance of queries that reference multi-statement table valued functions by surfacing runtime row counts to the query optimizer. Batch mode adaptive joins enables the choice of a query’s physical join algorithm to be deferred until actual query execution, improving performance based on runtime conditions.

  • Python をデータベース内で実行できる!
  • Microsoft Machine Learning Services というもの

Another new, key feature enhancement in CTP 2.0 of SQL Server 2017 is the ability to run the Python language in-database to scale and accelerate machine learning, predictive analytics and data science scripts. The new capability, called Microsoft Machine Learning Services, enables Python scripts to be run directly within the database server, or to be embedded into T-SQL scripts, where they can be easily deployed to the database as stored procedures and easily called from SQL client applications by stored procedure call. SQL Server 2017 will also extend Python’s performance and scale by providing a selection of parallelized algorithms that accelerate data transforms, statistical tests and analytics algorithms. This functionality and the ability to run R in-database and at scale are only available on Windows Server operating system at this time.

目がまた痛くなったきたので、寝ます。

昨日更に追加注文!

統計情報をデータベースから抜き出してみる

 左目の痛みは引いてきましたが、右目が痛くなってきました(泣)。前回の記事では、DBCC コマンドを使って統計情報を抜き出し、UPDATE STATISTICS を使い統計情報を更新してみました。ただ、これを繰り返すのは面倒ですよね。
ryuchan.hatenablog.com

今回は、データベースから一気に統計情報を取得するやり方を説明します。今回は SQL Server 2016 で行っていますが、他のバージョンでも大体同じ(はず)です。

  • データベースを右クリックし、タスク→スクリプト生成 をクリックします。
    f:id:koogucc11:20170417105553p:plain
  • 次へ をクリックします。
    f:id:koogucc11:20170417105603p:plain
  • 次へ をクリックします。
    f:id:koogucc11:20170417105614p:plain
  • 詳細設定 をクリックします。
    f:id:koogucc11:20170417105624p:plain
  • 次へ をクリックします。
    f:id:koogucc11:20170417105633p:plain
  • 次へ をクリックします。
    f:id:koogucc11:20170417105643p:plain
  • 完了 をクリックします。
    f:id:koogucc11:20170417105705p:plain

 生成された script.sql を参照すると、下記のような DDL 文があります。統計情報をデータベースから一括で抜き出すことができました。

UPDATE STATISTICS [Warehouse].[StockItemHoldings]([PK_Warehouse_StockItemHoldings]) WITH STATS_STREAM = 0x01000000010000000000000000000000B75C7F9A000000001D0F0000......

 SQL Server 2014 SP2 以降、SQL Server 2016 SP1 以降であれば DBCC CLONEDATABASE があるので、こんなことしなくてもいいんですが.....統計情報もクローンできちゃいますから。
ryuchan.hatenablog.com
ryuchan.hatenablog.com
ryuchan.hatenablog.com

 菌に敏感になってきたので、加湿器の掃除でもしよう。

統計情報をいじくってみる

 先週の木曜日くらいから調子悪くなって、金曜日に病院へいったら...アデノウィルスによる結膜炎 ( 流行性角結膜炎( EKC )) と診断されました。体は怠いし、目は痛いし最悪の状態です。アデノウィルスは感染力も強いので、出社もしばらく控えなければいけません。( 症状が出ている状態でお会いした方、ごめんなさいm(__)m )

 家では、こまめに石鹸で手を洗い

サラヤ シャボネット ユ・ム P-5泡 1kg ポンプ付

サラヤ シャボネット ユ・ム P-5泡 1kg ポンプ付

 アルコールで消毒しています。

【第2類医薬品】ヒビスコールS 500mL

【第2類医薬品】ヒビスコールS 500mL

 また、常に眼帯付けて、マスク付けて、他者に感染しないようにしています。
f:id:koogucc11:20170415183435j:plain

 久しぶりに眼帯をしたのですが、最近の眼帯って貼るタイプがあるんですね。これ、お勧めです。

貼れる眼帯 50枚入

貼れる眼帯 50枚入

 何種類か試したんですが、粘着力も程よく ( 粘着力が強すぎると、剥がすとき結構辛い。) 、とめる箇所は3点あるため安定します。
f:id:koogucc11:20170415184704p:plain

 アイパッドって(笑)
f:id:koogucc11:20170415182642j:plain

 病状報告はこれまでにして、本題に入ります。統計情報は SQL の安定したパフォーマンスを保つための大切な要素の一つです。可能な限り最新の状態に維持する必要があります。しかし、数十 TB 規模のデータベースで統計情報を最新化していく運用は容易ではありません。( 2014 以降増分統計がサポートされましたが、実運用では試したことありません。何かしら課題は出るんでしょう(´;ω;`) )

 統計情報を UPDATE STATISTICS で更新すると、非常に時間がかかり且つ運用に多少なり影響を与えることがあります。ふと、統計情報を運用系とは違う場所で作って、運用系に移せないかと考えてみました。統計情報を取得するには、DBCC SHOW_STATISTICS (Transact-SQL) | Microsoft Docs を使用します。

DBCC SHOW_STATISTICS ( table_or_indexed_view_name , target )   
[ WITH [ NO_INFOMSGS ] < option > [ , n ] ]  
< option > :: =  
    STAT_HEADER | DENSITY_VECTOR | HISTOGRAM | STATS_STREAM  

 WideWorldImporters のデータベースを使用して、統計情報を取得してみましょう。下記のクエリを SQL Server Management Studio で実行しましょう。

USE WideWorldImporters;
DBCC SHOW_STATISTICS("Sales.Orders",FK_Sales_Orders_ContactPersonID) WITH STATS_STREAM

f:id:koogucc11:20170416154505p:plain

 取得した Stats_Stream のデータを UPDATE STATISTICS (Transact-SQL) | Microsoft Docsで更新してみます。

UPDATE STATISTICS table_or_indexed_view_name   
    [   
        {   
            { index_or_statistics__name }  
          | ( { index_or_statistics_name } [ ,...n ] )   
                }  
    ]   
    [    WITH   
        [  
            FULLSCAN   
            | SAMPLE number { PERCENT | ROWS }   
            | RESAMPLE   
              [ ON PARTITIONS ( { <partition_number> | <range> } [, …n] ) ]  
            | <update_stats_stream_option> [ ,...n ]  
        ]   
        [ [ , ] [ ALL | COLUMNS | INDEX ]   
        [ [ , ] NORECOMPUTE ]   
        [ [ , ] INCREMENTAL = { ON | OFF } ]  
    ] ;  

<update_stats_stream_option> ::=  
    [ STATS_STREAM = stats_stream ]  
    [ ROWCOUNT = numeric_constant ]  
    [ PAGECOUNT = numeric_contant ]  

 下記のクエリを SQL Server Management Studio で実行してみましょう。

USE WideWorldImporters;

UPDATE STATISTICS Sales.Orders(FK_Sales_Orders_ContactPersonID) 
WITH STATS_STREAM = 
ROWCOUNT = 73595, PAGECOUNT = 189

f:id:koogucc11:20170416155118p:plain

 この動作を待機系または非同期のサーバで統計情報を取得して、運用系に更新する運用が取れれば統計情報更新の運用が少し楽になるかなぁ。(自身の参加しているプロジェクトで。) あと、データの分布がおおよそ判断できるものは、STATS_STREAM のデータを自分で作成して更新したいくらいです。ぱっと見ても内部仕様はわかりませんが.....(じーっと見てると、規則性がありそうですが....この情報、どこかに公開されているのかな?)

 過去に書いた記事の内容と合わせて考えると、クエリテスト時に大量レコードを発生させることなくテストができそう。できるかわかりませんが、今度実験してみます。
ryuchan.hatenablog.com

 ちょっと目の調子が良くなったので、記事書いてみましたが、また調子が悪くなってきました。嗚呼、早く完治しないかな...

最近、よく病気になります。免疫力下がってるのかな?