The Applied Statistics Workshop 2023

担当教員:(前期)大森裕浩 (Yasuhiro Omori)・下津克己 (Katsumi Shimotsu)、(後期)入江 薫 (Kaoru Irie)・奥井亮 (Ryo Okui)・久保川達也 (Tatsuya Kubokawa)
2023年12月22日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

廣瀬雅代 (九州大学)
Masayo Hirose (Kyushu University)
Abstract 近年, わが国でも貧困に関連した社会問題が提起されている。そのような状況をより細かく把握するため、都道府県、経済圏別などの地域別のエビデンス資料作成は非常に重要になると考えられる。そのような資料作成のために、本研究では、公的ミクロデータを利用してエリアレベルモデルに基づく都道府県別貧困率の推定とマッピングを行った。さらに本研究では、従来の分析方法との比較のために、Hirose, Ghosh and Ghosh (2023, Statistica Sinica)の逆正弦変換に基づく推定方法の改良も行っている。当日は、それらの分析結果を示すことにする。



2023年4月7日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

髙橋昂 (東京大学)
Abstract いくつかの単純な設定においては、統計的推論・学習の結果は統計力学のレプリカ法を用いることで精密に解析することができる。ここで、精密という言葉は汎化誤差などの量を、不等式評価するのではなく、値をぴったり予想するという意味である。本講演ではまず古典的な平均場理論による精密解析の例を紹介し、それがレプリカ法によっていかに導かれるかをレビューする。その後、レプリカ法を階層的に利用することによってブートストラップ法や転移学習型の手法に基づく半教師あり学習などの発展的設定での推論・学習の解析が可能となることを紹介する。
2023年4月14日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

Denny Wu (University of Toronto)
"High-dimensional learning in the presence of low-dimensional structure: a spiked random matrix perspective"
Abstract The spiked random matrix is a classical statistical model describing a low-dimensional signal "hidden" in high-dimensional noise. In this talk we introduce two examples where the spiked matrix model provides insight to modern machine learning problems, especially in the understanding of neural networks trained with gradient descent. First we consider the learning of a single-index target function under isotropic Gaussian input. In this setting, it is known that kernel method suffers from the curse of dimensionality in the proportional asymptotic limit; whereas for two-layer neural network, we show that the updated parameters after the first gradient step exhibit a signal (spike) + noise (bulk) structure, which can significantly improve the model performance. In the second example, we consider the scenario where the (anisotropic) input data already contains low-dimensional structure given by a spiked covariance. We show that both kernel ridge regression and neural network benefit from anisotropy, but neural network can adapt to such a structure more effectively.
2023年4月28日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

大津泰介 (London School of Economics and Political Science)
"Regression adjustment with many covariates"

Abstract This paper is concerned with estimation and inference on average treatment effects in randomized controlled trials when researchers observe potentially many covariates. By em- ploying Neyman’s (1923) finite population perspective, we propose a bias-corrected regression adjustment estimator using cross-fitting, and show that the proposed estimator has favorable properties over existing alternatives. For inference, we derive the first and second order terms in the stochastic component of the regression adjustment estimators, study higher order properties of the existing inference methods, and propose a bias-corrected version of the HC3 standard er- ror. Simulation studies show our cross-fitted estimator, combined with the bias-corrected HC3, delivers precise point estimates and robust size controls over a wide range of DGPs. To illus- trate, the proposed methods are applied to real dataset on randomized experiments of incentives and services for college achievement following Angrist, Lang, and Oreopoulos (2009).
2023年5月2日(火 Tuesday) 14:55-16:40
場所 東京大学大学院経済学研究科 第3教室
in Classroom 3 of the Economics Research Building
Xenia Miscouridou (Imperial College London)
"Cox-Hawkes: doubly stochastic spatiotemporal Poisson processes"

Abstract Hawkes processes are point process models that have been used to capture self-excitatory behaviour in social interactions, neural activity, earthquakes and viral epidemics. They can model the occurrence of the times and locations of events. We develop a new class of spatiotemporal Hawkes processes that can capture both triggering and clustering behaviour and we provide an efficient method for performing inference. We use a log-Gaussian Cox process (LGCP) as prior for the background rate of the Hawkes process which gives arbitrary flexibility to capture a wide range of underlying background effects (for infectious diseases these are called endemic effects). The Hawkes process and LGCP are computationally expensive due to the former having a likelihood with quadratic complexity in the number of observations and the latter involving inversion of the precision matrix which is cubic in observations. We propose a novel approach to perform MCMC sampling for our Hawkes process with LGCP background, using pre-trained Gaussian Process generators which provide direct and cheap access to samples during inference. We show the efficacy and flexibility of our approach in experiments on simulated data and use our methods to uncover the trends in a dataset of reported crimes in the US.
主催 統計輪講
2023年5月19日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

石原庸博 (高崎経済大学)
「ファクターの実現共分散による回帰を応用した多変量Realized Stochastic Volatility (RSV)モデル」

Abstract 複数の資産収益率のモデルとして多変量確率的ボラティリティ変動モデル(SV)モデルが広く用いられている.RSVモデルはSVモデルに高頻度データから計算された実現ボラティリティ・実現共分散を導入し推定・予測精度を向上したモデルである.本研究では高次元にも対応できるRSVモデルを提案する.金融経済学・ファイナンスにおけるマーケット・サイズ・バリューファクターをインデックスから定義し,その実現共分散とファクターモデルの構造を用いてモデリングする.ファクターモデルを低次元の多変量RSVモデルに変換し,高次元の収益率のモデルも並列計算をして計算時間を削減する.また,低次元の多変量RSVモデルとして,新たな多変量RSVモデルも提案する.業種別株価指数と業種別・スタイル別株式指数収益率を用いて,提案手法に基づいた将来の共分散の予測を行い,他のモデルとの比較を行う。
2023年6月9日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

岡達志 (慶應義塾大学)
"Distributional Vector Autoregression: Eliciting Macro and Financial Dependence"

Abstract Vector autoregression is an essential tool in empirical macroeconomics and finance for understanding the dynamic interdependencies among multivariate time series. In this study, we expand the scope of vector autoregression by incorporating a multivariate distributional regression framework and introducing a distributional impulse response function, providing a comprehensive view of dynamic heterogeneity. We propose a straightforward yet flexible estimation method and establish its asymptotic properties under weak dependence assumptions. Our empirical analysis examines the conditional joint distribution of GDP growth and financial conditions in the United States, with a focus on the global financial crisis. Our results show that tight financial conditions lead to a multimodal conditional joint distribution of GDP growth and financial conditions, and easing financial conditions significantly impacts long-term GDP growth, while improving the GDP growth during the global financial crisis has limited effect on financial conditions.
2023年6月16日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

Pallavi Basu (Indian School of Business)
"An Empirical Bayes Approach to Controlling the False Discovery Exceedance"

Abstract In large-scale multiple hypothesis testing problems, the false discovery exceedance (FDX) provides a desirable alternative to the widely used false discovery rate (FDR) when the false discovery proportion (FDP) is highly variable. We develop an empirical Bayes approach to control the FDX. We show that, for independent hypotheses from a two-group model and dependent hypotheses from a Gaussian model fulfilling the exchangeability condition, an oracle decision rule based on ranking and thresholding the local false discovery rate (lfdr) is optimal in the sense that the power is maximized subject to the FDX constraint. We propose a data-driven FDX procedure that uses carefully designed computational shortcuts to emulate the Oracle rule. We investigate the empirical performance of the proposed method using both simulated and real data and study the merits of FDX control through an application for identifying abnormal stock trading strategies. This is joint work with Luella Fu, Alessio Saretto, and Wenguang Sun.
2023年6月23日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

末石直也 (神戸大学)
"A Misuse of Specification Tests"

Abstract Empirical researchers often perform model specification tests, such as the Hausman test and the overidentifying restrictions test, to confirm the validity of estimators rather than the validity of models. This paper examines the effectiveness of specification pretests in finding invalid estimators. We study the local asymptotic properties of test statistics and estimators and show that locally unbiased specification tests cannot determine whether asymptotically efficient estimators are asymptotically biased. The main message of the paper is that correct specification and valid estimation are different issues. Correct specification is neither necessary nor sufficient for asymptotically unbiased estimation under local overidentification.
2023年6月30日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

海道宏明(Boston University)
“Robust Tests of Model Incompleteness in the Presence of Nuisance Parameters” (with Shouowen Chen)

Abstract Economic models may exhibit incompleteness depending on whether they admit certain policy-relevant features such as strategic interaction, endogeneity, or state dependence. We develop a novel test of model incompleteness and analyze its asymptotic properties. The test builds on a score function constructed from the least favorable parametric model, and we show that it remains computationally tractable even with nuisance parameters. The tractability attains because it suffices to estimate nuisance parameters only under the null hypothesis of model completeness. We illustrate the test by applying it to a model of market entry and a triangular model with a set-valued control function.
2023年7月14日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

加藤賢悟 (Cornell University)
"Entropic optimal transport: stability and limit theorems"

Abstract We study limit theorems for entropic optimal transport (EOT) maps, dual potentials, and the Sinkhorn divergence. The key technical tool we use is a first and second order Hadamard differentiability analysis of EOT potentials with respect to the underlying distributions. Given the differentiability results, the functional delta method is used to obtain central limit theorems for empirical EOT potentials and maps. The second order functional delta method is leveraged to establish the limit distribution of the empirical Sinkhorn divergence under the null. Building on the latter result, we further derive the null limit distribution of the Sinkhorn independence test statistic and characterize the correct order. Since our limit theorems follow from Hadamard differentiability of the relevant maps, as a byproduct, we also obtain bootstrap consistency and asymptotic efficiency of the empirical EOT map, potentials, and Sinkhorn divergence. This talk is based on joint work with Ziv Goldfeld, Gabriel Rioux, and Ritwik Sadhu.
2023年7月21日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

Stanley Iat-Meng, Ko (東北大学)
"Asset Pricing with Co-search Interaction"

Abstract We study the effect of internet co-search activities of listed stocks on their returns in the stock market. We explore the internet traffic on the US Securities and Exchange Commission’s (SEC) Electronic Data Gathering, Analysis, and Retrieval (EDGAR) website which holds all public US companies' information with hundreds of thousands of document views per day by users. We identify co-searched firms, i.e. one firm is searched subsequently after another, and incorporate such information in the conventional asset pricing model. The contributions of this study are threefold. First, we introduce the micro-level behavioral information of individual stocks to the empirical asset pricing literature, whereas the traditional asset pricing studies focus on aggregated portfolios. Second, with the identification of co-search peers, we define and construct the co-search network in the universe of trading stocks. Through the lens of the co-search network, we identify the virtual spatial stock return dependence across the network. Third, we extend the traditional liner asset pricing models by using the Spatial Arbitrage Pricing Theory (S-APT).
2023年10月20日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

Jiaying Gu (University of Toronto)
“Identification of Dynamic Panel Logit Models with Fixed Effects”, joint work with Christopher Dobronyi and Kyoo il Kim
Abstract We show that the identification problem for a class of dynamic panel logit models with fixed effects has a connection to the truncated moment problem in mathematics. We use this connection to show that the sharp identified set of the structural parameters is characterized by a set of moment equality and inequality conditions. This result provides sharp bounds in models where moment equality conditions do not exist or do not point identify the parameters. We also show that the sharp identified set of the non-parametric latent distribution of the fixed effects is characterized by a vector of its generalized moments, and that the number of moments grows linearly in T. This final result lets us point identify, or sharply bound specific classes of functionals, without solving an optimization problem with respect to the latent distribution. We illustrate our identification result with several examples, and an empirical application on modeling children’s respiratory conditions.
2023年10月27日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

Stanislav Volgushev (University of Toronto)
"Structure learning for extremes"
Abstract Extremal graphical models are sparse statistical models for multivariate extreme events. The underlying graph encodes conditional independencies and enables a visual interpretation of the complex extremal dependence structure. In this talk we present a data-driven methodology to learn the underlying graph. For tree models and general extreme-value distributions, we show that the tree can be learned in a completely non-parametric fashion. For the specific class of Hüsler-Reiss distributions, we discuss methodologies for estimating general graphs. Conditions that ensure consistent graph recovery in growing dimensions are provided.
2023年11月10日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

Ilia Negri(University of Calabria, Rende (CS), Italy)
"New advances in change point problems for dependent observations"
Abstract The Z-process method was introduced as a general unified approach based on partial estimation functions to construct test statistics for a wide range of statistical change-point problems. This method can simultaneously test for changes in any of the model's parameters. We investigate the asymptotic distribution of the test statistics under the null hypothesis and under a very general alternative hypothesis. Applications of the method to change-point problems in a diverse set of models with dependent observations are also discussed. Specifically, it is applied to diffusion processes, both for ergodic models and for some models with random Fisher information matrices. Furthermore, we address the issue of testing for parameter changes in linear time series models. Finally, some simulated studies are presented.
2023年11月17日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

各務和彦 (名古屋市立大学)
Kazuhiko Kakamu (Nagoya City University)
Abstract 本講演では,始めに,グループ・データに基づく所得分布の推定方法を概観する。その上で,グループ・データに基づいて、母集団の一般化エントロピー(Generalized Entropy: GE)とその部分母集団のGEを同時に推定する問題を考え,母集団のGEをグループ間不平等とグループ内不平等に分解する。母集団と部分母集団のそれぞれについてパラメトリック分布を仮定してGE指標を推定すると,分解と整合的な推定値が得られない。そこで,分解との整合性をとるために,母集団のGEとグループ間不平等の推定値をベンチマークとして,制約付きベイズ推定を用いて各部分母集団のGEを推定する。提案手法を日本のデータに適用し,全国のGEと各都道府県のGEを推定し,全国のGEを都道府県間不平等と都道府県内不平等に分解する。さらに,各都道府県のGEを市町村間不平等と市町村内不平等に分解する。
2023年12月1日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

唐木田亮 (産業技術総合研究所)
Ryo Karakida (The National Institute of Advanced Industrial Science and Technology, AIST)
Abstract 深層学習の発展により, 異なるタスク間で同一のモデルを継続的に学習する知識転移の利用が増えつつある. こうした知識転移の枠組みはその予測性能の向上や劣化の挙動の理解が限定的であるため, 単純なモデルでの解析を通して理解を深めたい. 本講演では, 問題設定の背景を紹介しつつ, 適当な基底を持つ線形モデルの継続学習を過剰パラメータ化のもとで解析する. 具体的には, 統計力学に基づくレプリカ解析を使って, 汎化誤差の解析的な表現を導出する. 学習の継続による汎化性能の増減は, タスク間の類似度とサンプル数のバランスに依存して, 非単調に変化することを明らかにする. また, モデル平均との比較やbias-variance分解を通し, 継続学習の利点を議論する.
2023年12月8日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark] までご連絡下さい。

大久保祐作 (岡山大学)
Yusaku Ohkubo (Okayama University)
Abstract 統計学分野における論文出版数は、近年のデータサイエンス流行と相まってますます増加している。こうした事態は同領域に関する知見が深まるという点で、研究者にとっても実務家にとっても歓迎すべき状況のはずだ。しかしながら、論文数の増大に伴って統計学の研究動向が把握しにくくなるという側面も存在しうる。特に、データ分析という作業がこれまで充分普及してこなかった領域の実務家が統計学の応用を考えた場合には、偏った研究情報を基に分析手法を選択することによって、適切な手法にアクセスできなくなる恐れがある。 そこで一つの試案として、計量書誌学の手法を活用して近年の統計学動向を整理することを考える。計量書誌学とは、主に学術論文の出版データやその引用関係を定量的に分析する学術領域の総称である。本講演では、主に報告者が専門としてきた生態学の事例を基に、最近の取り組みを紹介する。


[ English Top ]