
The Applied Statistics Workshop 2018




2018年5月11日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


Enrique Sentana (Center for Monetary and Financial Studies)

"Specification tests for non-Gaussian maximum likelihood estimators"

要旨(Abstract)  We propose generalised DWH specification tests which simultaneously compare three or more likelihood-based estimators of conditional mean and variance parameters in multivariate conditionally heteroskedastic dynamic regression models. Our tests are useful for GARCH models and in many empirically relevant macro and finance applications involving VARs and multivariate regressions. To design powerful and reliable tests, we determine the rank deficiencies of the differences between the estimators' asymptotic covariance matrices under the null of correct specification and take into account that some parameters remain consistently estimated under the alternative of distributional misspecification. Finally, we provide finite sample results through Monte Carlo simulations.



2018年5月25日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


堤盛人 (筑波大学)


要旨(Abstract)  割合などのように、値が非負で和が一定となるようなデータは「組成データ」と呼ばれている。その名称自体 は一般的には知られていないものの、至る所で目にするデータの種類である。統計学的には、疑似相関の問題か ら、組成データの分析の際には値の総和が一定であるという定数和制約を考慮する必要があり、地質学を中核に これを考慮した「組成データ解析(Compositional Data Analysis:CoDA)」が発展している(Aitchison, 1986.)。 しかしながら、Aitchison (1986)から既に30年も経過しているにもかかわらず、未だCoDAの研究において取り 扱われているのは自然科学データが大半で、社会経済データを用いた実証研究は皆無に近く、社会科学の分野で はその重要性・有用性がほとんど認識されていない。 本報告では、人口や交通、土地利用などの社会経済データを用いたCoDAの結果を紹介しながら、空間計量経済 学とCoDAの融合など、社会経済データへの応用を主眼にCoDAの新たな展開の可能性を探る。 本報告は、吉田崇紘氏(国立環境研究所・特別研究員)との共同研究によるものである。



2018年6月11日(月 Monday) 10:30-12:00 ※日時に注意



東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


Marc Henry (The Pennsylvania State University)

"Sharp bounds and testability of a Roy model of STEM major choices" (joint with Ismael Mourifie and Romuald Meango)

要旨(Abstract) We analyze the empirical content of the Roy model, stripped down to its essential features, namely sector specific unobserved heterogeneity and self-selection on the basis of potential outcomes. We characterize sharp bounds on the joint distribution of potential outcomes and testable implications of the Roy self-selection model under an instrumental constraint on the joint distribution of potential outcomes we call stochastically monotone instrumental variable (SMIV). We show that testing the Roy model selection is equivalent to testing stochastic monotonicity of observed outcomes relative to the instrument. Special emphasis is put on the case of binary outcomes, which has received little attention in the literature to date. For richer sets of outcomes, we emphasize the distinction between pointwise sharp bounds and functional sharp bounds, and its importance, when constructing sharp bounds on functional features, such as inequality measures. We analyze a Roy model of college major choice in Canada and Germany within this framework, and we take a new look at the under-representation of women in STEM.



2018年6月22日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


マクリン謙一郎 (The University of Chicago)

"Large-Scale Dynamic Predictive Regressions"

要旨(Abstract) We develop a novel "decouple-recouple" dynamic predictive strategy and contribute to the literature on forecasting and economic decision making in a data-rich environment. Under this framework, clusters of predictors generate different latent states in the form of predictive densities that are later synthesized within an implied time-varying latent factor model. As a result, the latent inter-dependencies across predictive densities and biases are sequentially learned and corrected. Unlike sparse modeling and variable selection procedures, we do not assume a priori that there is a given subset of active predictors, which characterize the predictive density of a quantity of interest. We test our procedure by investigating the predictive content of a large set of financial ratios and macroeconomic variables on both the equity premium across different industries and the inflation rate in the U.S., two contexts of topical interest in finance and macroeconomics. We find that our predictive synthesis framework generates both statistically and economically significant out-of-sample benefits while maintaining interpretability of the forecasting variables. In addition, the main empirical results highlight that our proposed framework outperforms both LASSO-type shrinkage regressions, factor based dimension reduction, sequential variable selection, and equal-weighted linear pooling methodologies.



2018年7月20日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


大屋幸輔 (大阪大学)

Frequency-wise causality analysis in infinite order vector autoregressive processes (joint with Ryo Kinoshita and Mototsugu Shintani )

要旨(Abstract) This paper derives the asymptotic properties of frequency-domain causality measure estimator using the vector autoregressive model of infinite order and proposes a test of non-causality at a particular frequency, analogues to the one proposed in previous study. Further the confidence intervals of causality measure and testing procedures to detect possible structural breaks in causality measure at some frequencies are provided using our asymptotic results. Simulation results confirm that our procedure works well with sample size typically available in practice. We illustrate the usefulness of our method via an application to financial data.



2018年9月18日(火 Tuesday) 16:30-17:45 ※日時に注意


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


Mike West (Duke University)

"Bayesian Forecasting of High-Dimensional Count-Valued Time Series"

要旨(Abstract)  Problems of forecasting many, related time series of counts arise in many areas, and are particularly prevalent in consumer demand and sales contexts. With a focus on improving multi-step ahead forecasting of daily sales of many supermarket items across a system of outlets, we have developed new classes of models to address efficiency, efficacy and scalability of dynamic models based on the concept of decouple/recouple applied to multiple series that are individually represented via novel univariate state-space models. The latter involve dynamic generalized linear models for binary and conditionally Poisson time series, with dynamic random effects for over-dispersion, allowing use of dynamic covariates in both binary and non-zero count components. Sequential Bayesian analysis allows fast, parallel analysis of sets of decoupled time series. New multivariate models then enable information sharing in contexts when data at a more highly aggregated level provide more incisive inferences on shared patterns such as trends and seasonality. This involves a novel multi-scale approach? one example of the concept of decouple/recouple in time series? that avoids the complexity and computational challenges of traditional hierarchical modelling approaches. The analysis incorporates cross-series linkages while insulating parallel estimation of univariate models, hence enables scalability in the number of series.
 Extension of these models are dynamic count mixture models to apply to forecasting individual customer transactions, coupled with a novel probabilistic model for predicting counts of items per transaction. The latter involves a new dynamic binary cascade concept that contributes two main features: first, it aids in resolving some of the otherwise unpredictable variation in the sales series; second, it allows probabilistic inference on rare events (otherwise unpredictable and very infrequent “high” outcomes on individual series). The resulting transactions-sales models allow use of dynamic covariates in both transaction and sales levels components, and can incorporate a diverse range of trend, seasonal, price, promotion, random effects and other outlet-specific predictors at the level of individual items. Again, sequential Bayesian analysis allows fast, parallel analysis of sets of decoupled time series, while being automatically adaptable across items that may exhibit widely varying characteristics. Further, the multi-scale approach shares information across series at the transaction level.
 The motivating case study context of many-item, multi-period, multi-step ahead supermarket sales forecasting provides examples that demonstrate improved forecast accuracy in a range of traditional and statistical metrics, while also illustrating the benefits of full probabilistic models. The talk will discuss a range of examples and highlight questions of forecast accuracy metrics and broader questions of probabilistic forecast accuracy assessment, decision analytic choice of point forecasts (when desired) and forecast accuracy comparison.



2018年9月28日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


Sanjay Chaudhuri (National University of Singapore)

An easy-to-use empirical likelihood ABC method

要旨(Abstract) Many scientifically well-motivated statistical models in natural, engineering and environmental sciences are specified through a generative process, but in most cases it may not be possible to write down a likelihood for these models analytically. Approximate Bayesian computation (ABC) methods, which allow Bayesian inference in these situations, are typically computationally intensive. Recently, empirical
likelihood based ABC methods, which are computationally attractive, have been suggested in the literature. The current empirical likelihood methods rely on the availability of a set of suitable analytically tractable estimating equations. We propose an easy-to-use empirical likelihood ABC method, where the only inputs required are a choice of summary statistic, it’s observed value, and the ability to simulate summary statistics for any parameter value under the model. It is shown that the posterior obtained using the proposed method is consistent, and its performance is explored using various examples.

Joint work with Shubhroshekhar Ghosh, David Nott and Pham Kim Cuc, National University of Singapore.



2018年10月5日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]



「混合モデルの提案とその統計的性質 」

要旨(Abstract)  混合モデルにおいて対数尤度関数は凸性を失うが柔軟なモデリングを可能にする.この発表では,情報幾何の発想から密度関数,予測関数,ハザード関数,ロス関数などの空間上の測地線がコルモゴロフ・南雲(KN)平均によって構築されることを紹介する.この測地線はアルキメディアン・コピュラとも密接な関係がある.特にロス関数のKN平均による結合は一般化混合モデルと呼ばれる統計モデルが誘導される.この統計的な性質を考察し,従来の混合モデルと対数尤度関数の関係を比較検討する.



2018年10月19日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


持橋大地(統計数理研究所数理・推論研究系 )


要旨(Abstract)  隠れマルコフモデル(HMM)は情報科学のみならず社会科学へも適用される、時系列の基本的なモデルであるが, 離散的な隠れ状態はフラットであり, 状態のさらに細かい区別や, 状態の間の関係を適切に表現することができない。これには状態を木構造で構造化することが有用であるが, 分岐の数や木の深さには無限の曖昧性が存在し,それらをすべて網羅した中からモデル選択を行うことは不可能である。 本講演ではこれに対し, 無限次元離散分布であるディリクレ過程の積である木構造Stick-breaking過程(Adams+ NIPS2010)をそれ自体木構造上で階層化することで,階層的木構造Stick-breaking過程に基づいた無限木構造隠れMarkovモデル(ITHMM)について解説する。提案法は, 無限隠れMarkovモデル(Beal 2001, Teh 2006)の階層クラスタリング化ともとらえることができる。無限次元離散分布であるディリクレ過程, およびStick-breaking過程の導入から始め,自然に本手法の理解につながるようにしたい。



2018年11月2日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]



「クロネッカー積共分散構造の最尤推定量の存在・非存在 - あるテンソルランク最小化問題 」




ベクトル値ガウス分布に従う n 個の iid サンプルから,その分散共分散行列を最尤推定する問題を考える.分散共分散行列に何も構造がない場合は,尤度関数が有限の最大値を持つ(すなわち,MLE が存在する)ための必要十分条件は,サンプル数 n が行列サイズ以上であることである.しかし,分散共分散行列が構造を持ち,より少ないパラメータで記述されている場合はその限りではない.本講演では,分散共分散行列が m1 x m1 行列と m2 x m2 行列のクロネッカー積である場合を扱う.MLEの存在・非存在は,m1 x m2 x n テンソルのある種のランクで特徴づけられ,とくに n=2 の場合は,そのランクが整数計画の解として陽に与えられることが示される.なお具体的に与えた m1, m2 については,このテンソルのランクはグレブナー基底計算でも具体的に求めることができ,研究の過程ではこの計算を多く行っている.時間があれば,本問題とクロネッカーの標準形,制御理論における可制御・可観測性との関係についても説明する. (Mathias Drton 氏との共同研究)  



2018年12月7日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


大津泰介(London School of Economics)

"Jackknife, small bandwidth and high-dimensional asymptotics"


要旨(Abstract) This paper proposes the jackknife empirical likelihood (JEL) inference method for semiparametric problems. We first establish the limiting distribution of the JEL statistic for a general semiparametric model under the conventional asymptotics. Then we investigate three non-standard asymptotic problems: small bandwidth asymptotics for weighted average derivatives, many-weak instruments asymptotics for instrumental variable regression, and many covariates asymptotics for high-dimensional regression models. For these cases, we establish the asymptotic properties of the JEL statistic and develop a unified framework to recover asymptotic pivotalness. Our theoretical results are illustrated by a simulation study.



2018年12月21日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


井上篤(Vanderbilt University)

"The Uniform Validity of Impulse Response Inference in Autoregressions"


要旨(Abstract) Existing proofs of the asymptotic validity of impulse response inference based on higher-order autoregressions are pointwise only. In this paper, we establish the uniform asymptotic validity of conventional asymptotic and bootstrap inference about individual impulse responses and vectors of impulse responses at fixed horizons. For inference about vectors of impulse responses to be uniformly valid, lag-augmented autoregressions are required. Inference about individual impulse responses is uniformly valid under weak conditions even without lag augmentation. We introduce a new rank condition that ensures the uniform validity of inference on impulse responses. The highest finite-sample accuracy is achieved when bootstrapping the lag-augmented autoregression using the bias adjustments of Kilian (1999). The resulting confidence intervals remain accurate even at comparatively long horizons, obliviating the need for nonstandard long-horizon asymptotics in many applications.  



2019年1月11日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]




要旨(Abstract)  標本数のみを無限大とする大標本漸近理論の枠組みでは,一致性を持つ情報量規準は多く存在する.一方で,近年,ハードウェアの発展により,蓄積・解析できるデータ数は爆発的に増大し,目的変数ベクトルの次元数が大きいデータである,高次元データの解析の需要が高まっている.高次元データにおける一致性は,標本数と次元数をその比が0以上1未満の定数に収束すると条件の下で標本数を無限大とする大標本・高次元漸近理論の枠組みで評価したほうが妥当である.本発表では,多変量線形回帰モデルの変数選択に着目し,大標本・高次元漸近理論の枠組みによる情報量規準の一致性の評価法を紹介する.



2019年1月31日(木 Thrsday) 13:00-18:05 


東京大学大学院経済学研究科 学術交流棟 (小島ホール)2階 小島コンファレンスルーム [地図]
in Kojima Conference Room on the 2nd floor of the Economics Research Annex (Kojima Hall) [Map]



科学研究プロジェクト 「経済統計・政府統計の理論と応用」
オーガナイザー: 国友直人・山本拓


13:00〜13:05 山本拓

<セッションI>  公的統計の課題解決
Chair: 山本拓
13:35〜14:05「高齢無業世帯の貯蓄と消費行動について 」川崎茂(日本大学)
14:05〜14:35「人口減少・超高齢社会と人的資本― 政府統計における人口資質の視点 ―」金子隆一(明治大学)


<セッションII> 経済統計の課題解決
Chair: 川崎茂
14:50〜15:20「ランダムネスによるプライバシー保護の評価 」星野伸明(金沢大学)
15:50〜16:20「テキストデータからの情報抽出を利用した時系列予測」 川崎能典(統計数理研究所)


<セッションIII> 経済統計データ分析の展開
Chair: 国友直人
16:35〜17:05千木良弘朗(東北大学「Statistical Inference in Regression Models with Possibly
Integrated Processes」(山本拓(一橋大学)と共著)
17:05〜17:35「Covariance Structure Analysis of Panel Regression Models」早川和彦(広島大学)
17:35〜18:05大森裕浩(東京大学)「Multivariate Stochastic Volatility Model with Realized
Volatilities and Pairwise Realized Correlations」(山内雄太(東京大学)と共著)



2019年2月15日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


鈴木大慈 (東京大学)


要旨(Abstract)  ReLU活性化関数を用いた深層ニューラルネットワークの学習能力について,特にスパース推定との関係を通して理論解析結果を述べる.深層学習の学習能力の高さは,その基底を対象の関数に合わせて生成するところにあり,それはモデルが非凸であることが本質的に重要である.これはスパース推定による基底選択と共通点が多く,縮小ランク回帰やL0-正則化学習といった,モデルが非凸であるスパース推定と結び付けてその優位性を調べることが可能である.本研究では,そのような視点に基づき,深層学習のBesov空間における近似精度および推定精度を解析する.また,mixed-smoothnessを持ったBesov空間での学習能力も解析する.導出された近似誤差のレートは任意の非適応的関数近似手法よりも良いレートを達成し,推定精度についてもpoly-log(n)オーダーを除いてミニマックス最適レートを達成することを紹介する.このことから,特に非凸性の強い関数クラスにおいて線形推定量よりもミニマックスリスクの意味で優越することが示される.また,mixed-smoothnessを仮定すれば次元の影響を小さく抑えることができることも示される.さらに,時間があれば中間層に対応するカーネル関数が低ランクに近いときに汎化性能が上がることも紹介する.これらの性質は,深層ニューラルネットワークが特徴量抽出機として高い適応能力を持つことを示唆している.



2019年2月22日(金 Friday) 16:50-18:35


東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室 [地図]
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [Map]


Dale J. Poirier (University of California, Irvine)

"Mostly Harmless Bayesian Econometrics"

要旨(Abstract) Please clic [here] to see the details.