The Applied Statistics Workshop 2022

日時
2023年3月2日(木 Thursday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面またはZoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
Dan Ben-Moshe (Ben Gurion University of the Negev)
"Regulation and Frontier Housing Supply" [Paper]

Abstract Regulation is a major driver of housing supply, yet often not easily observed. Using only apartment prices and building heights, we estimate frontier costs, defined as housing production costs absent regulation. Identification uses conditions on the support of supply and demand shocks without recourse to instrumental variables. In an application to Israeli residential construction, we find on average 43% of housing price ascribable to regulation, but with substantial dispersion, and with higher rates in areas that are higher priced, denser, and closer to city centers. We also find economies of scale in frontier costs at low building heights. This estimation takes into account measurement error, which includes random unobserved structural quality. When allowing structural quality to vary with amenities (locational quality), and assuming weak complementarity (the return in price on structural quality is nondecreasing in amenities) among buildings within 1km, we bound mean regulation from below by 19% of prices.

以下本年度終了分

 

日時
2022年4月8日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面またはZoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
植松 良公(一橋大学)
"High-Dimensional Robust Inference via Debiased Rank Lasso"

Abstract We propose an inferential framework that is robust to heavy-tailed error distributions in high-dimensional linear regression models. A key ingredient of the robustness is the rank lasso by Wang, Peng, Bradic, Li, and Wu (2020, JASA), but the estimator is not asymptotically normally distributed thanks to the regularization. In this presentation, we propose the debiased rank lasso estimator, which can establish the asymptotic normality. Furthermore, using this estimator, we develop a method for robust simultaneous inference that can discover important variables in the linear regression models with the false discovery rate (FDR) controlled under the preassigned level. We also confirm the performance through extensive numerical simulations. We find that our procedure controls the FDR with exhibiting higher power than the original method when the error distribution is heavy-tailed.
日時
2022年5月20日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面またはZoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
肥後 雅博(東京大学)
『国土交通省「建設工事受注動態統計」問題を巡って』 [Slides]
Abstract 2021年末、国土交通省が作成する「建設工事受注動態統計」における不適切な計数処理が明らかになった。 2018年末に明らかになった厚生労働省「毎月勤労統計」と同様に、日本経済を把握する中核的な統計の精度を毀損する深刻な問題であり、統計ユーザーから強い批判を受ける事態となっている。 本論文では、「建設工事受注動態統計」における不適切な計数処理の内容を整理するとともに、不適切処理が及ぼす影響を試算する。 現時点の試算では、不適切処理がもたらした建設工事受注高への影響はかなりの大きさとなったが、GDPへの影響は限定的にとどまる見通しである。 さらに、不適切処理が発生した原因および不適切処理問題を繰り返さないために必要となる再発防止策について、国土交通省が設置した検証委員会の報告書の提言を紹介しつつ、筆者の見解を提示する。
日時
2022年6月9日(木 Thursday) 10:00-12:00
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面またはZoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

 

報告
Jason Xu(Duke University)
"Likelihood-based Inference for Stochastic Epidemic Models via Data Augmentation"

Abstract Stochastic epidemic models such as the Susceptible-Infectious-Removed (SIR) model are widely used to model the spread of disease at the population level, but fitting these models to data present significant challenges.
In particular, the marginal likelihood of such stochastic processes conditioned on observed endpoints a notoriously difficulttask.
As a result, exact likelihood inference is typically considered intractable in the presence of missing data, and practitioners often resort to simulation methods or approximations.
We discuss some recent contributions that enable direct inference using the likelihood of observed data, focusing on a perspective that makes use of latent variables to explore configurations of the missing data within a Bayesian framework.
Motivated both by count data from large outbreaks and high-resolution contact data from mobile health studies, we show how a data-augmented MCMC approach successfully learns the interpretable epidemic parameters and scales to handle large realistic data settings efficiently.
日時
2022年6月10日(金 Friday) 16:50-18:35
場所 オンライン
Online on Zoom

※ Zoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
寺田 吉壱(大阪大学)
「関数データに対する半教師付き分類とその応用」

Abstract 近年,計測技術の進歩に伴い,連続的・断続的に記録されるデータが多くなってきている.例えば,データ運動に関連する軌道データなどが挙げられる.このようなデータに対しては,実数空間上の確率分布を考えるよりも,ある(有界な)領域や区間上のランダムな関数(もしくは,確率過程)を考える方が自然である.ある領域や区間上で連続的・断続的に観測されたデータをランダムな関数や確率過程の実現値として捉えたデータ解析は関数データ解析と呼ばれ,統計科学分野において盛んに研究が進められている. 本研究では,関数データにおいて, 正例のデータと正例と負例が混在したラベルの無いデータのみから2値分類を行う半教師付き分類問題 (PU classification)を扱う. 関数データの潜在的な無限次元性に着目することで,この分類問題に適した射影に基づく距離関数を提案し,距離関数の推定値に基づくシンプルな関数データに対するPU classificationの方法を提案する.提案手法の大きな利点として,混合率の推定を必要としないことが挙げられる.さらに,通常の判別問題とほぼ同じ正則条件の下,誤判別率が漸近的に0となるような完璧な分類が達成可能であることを理論的に示す. さらに, 選手生命に関わる怪我のリスクがある選手を特定する問題に提案手法を応用した例を紹介する. また, 時間があれば, 教師なし分類問題に対する結果も紹介する.
日時
2022年6月17日(金 Friday) 16:50-18:35
場所 オンライン
Online on Zoom

※ Zoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
松井 秀俊(滋賀大学)
「スパース推定を用いた関数切断線形モデルの構築と農業データへの応用」

Abstract 観測個体がそれぞれ時間等の経過に伴い繰り返し測定されたデータを関数として処理し、得られた関数集合を対象とした分析方法や理論は、関数データ解析とよばれている。本研究では、説明変数が関数データ、目的変数がスカラーデータとして与えられたとき、これらの関係をモデル化する関数回帰モデルの1つである変化係数関数線形モデルに対してスパース推定を適用する方法を紹介する。これにより、目的変数と関連していると考えられる説明変数の時点の選択を行うことができる。提案した手法を、農作物の収穫量のデータの分析に適用し,何日前までの環境要因が収穫量と関連しているかを調査する。
日時
2022年6月24日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面およびZoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告

Marc Henry(The Pennsylvania State Univeristy)
"Finite Sample Inference in Incomplete Models" Lixiong Li and Marc Henry [Paper]

Abstract We propose confidence regions for the parameters of incomplete models with exact coverage of the true parameter in finite samples. Our confidence region inverts a test, which generalizes Monte Carlo tests to incomplete models. The test statistic is a discrete analogue of a new optimal transport characterization of the sharp identified region. Both test statistic and critical values rely on simulation draws from the distribution of latent variables and are computed using solutions to discrete optimal transport, hence linear programming problems. We also propose a fast preliminary search in the parameter space with an alternative, more conservative yet consistent test, based on a parameter free critical value.
日時
2022年7月1日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面またはZoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
森川 耕輔(大阪大学)
「NMAR欠測値データに対する最適なセミパラメトリック推測法と標本調査への応用」

Abstract 応用上、数理的に理論が整備された理想的な状況下でデータを得ることは難しい。このような問題は時間的・経済的な制約のため、母集団全体から特定のデータのみの抽出、回答拒否によるデータの欠測値の影響により、標本が必ずしも母集団全体を代表しないために生じる。また、近年脚光を浴びている因果推論における解析手法も本質的には欠測値データ解析の枠組みに入る。これらのデータを解析する際、通常、データが観測されるかどうかが観測されている変数だけで説明可能であることを要求するMAR(missing at random)という仮定が置かれる。本報告では、これらの仮定を必要としないNMAR(not missing at random)の下でのモデルの識別性およびセミパラメトリック推定量を紹介する。また、標本調査においては包含確率という母集団から標本を抽出する際用いられた確率値をデータとして利用することができる。この包含確率の情報を最大限生かした、セミパラメトリック漸近有効推定量を提案する。
日時
2022年7月15日(金 Friday) 16:50-18:35
場所 オンライン
Online on Zoom

※ Zoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
柳 貴英(京都大学)

"Causal Inference with Noncompliance and Unknown Interference"
Abstract In this paper, we investigate a treatment effect model in which individuals interact in a social network and they may not comply with the assigned treatments. We introduce a new concept of exposure mapping, which summarizes spillover effects into a fixed dimensional statistic of instrumental variables, and we call this mapping the instrumental exposure mapping (IEM). We investigate identification conditions for the intention-to-treat effect and the average causal effect for compliers, while explicitly considering the possibility of misspecification of IEM. Based on our identification results, we develop nonparametric estimation procedures for the treatment parameters. Their asymptotic properties, including consistency and asymptotic normality, are investigated using an approximate neighborhood interference framework by Leung (2021). For an empirical illustration of our proposed method, we revisit Paluck et al.'s (2016) experimental data on the anti-conflict intervention school program.
日時
2022年7月29日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面またはZoom上でのオンライン参加となります。ZoomのURLはシラバスでご確認ください。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
山形 孝志(ヨーク大学)
"Discovering the Network Granger Causality in Large Vector Autoregressive Models" (Joint work with Yoshimasa Uematsu)

Abstract In this paper we propose novel inferential procedures for network Granger-causality in high-dimensional vector autoregressive (VAR) models. In particular, we propose two procedures which are designed to control the false discovery rate (FDR). The first procedure for multiple testing with controlled FDR is based on the limiting normal distributions of the t-statistics constructed by the debiased lasso estimators. The second procedure is based on the bootstrap distributions of the t-statistics, constructed by imposing the null hypotheses. The theoretical properties of these proposed procedures, including FDR control and power guarantees, are investigated. The finite sample evidence suggests that both procedures can successfully control the FDR while maintaining high power. The proposed methods are applied to discover network Granger-causality in a large number of macroeconomic variables and in regional house prices in the UK.
日時
2022年10月7日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
坂口 翔政(東京大学)
"Constrained Classification and Policy Learning" (joint work with Toru Kitagawa and Aleksey Tetenov)

Abstract Modern machine learning approaches to classification,including AdaBoost, support vector machines, and deep neural networks, utilize surrogate loss techniques to circumvent the computational complexity of minimizing empirical classification risk. These techniques are also useful for causal policy learning problems, since estimation of individualized treatment rules can be cast as a weighted (cost-sensitive) classification problem. Consistency of the surrogate loss approaches studied in Zhang (2004) and Bartlett et al. (2006) crucially relies on the assumption of correct specification, meaning that the specified set of classifiers is rich enough to contain a first-best classifier. This assumption is, however, less credible when the set of classifiers is constrained by interpretability or fairness, leaving the applicability of surrogate loss based algorithms unknown in such second-best scenarios. This paper studies consistency of surrogate loss procedures under a constrained set of classifiers without assuming correct specification. We show that in the setting where the constraint restricts the classifier's prediction set only, hinge losses (i.e., ℓ1-support vector machines) are the only surrogate losses that preserve consistency in second-best scenarios. If the constraint additionally restricts the functional form of the classifier, consistency of a surrogate loss approach is not guaranteed even with hinge loss. We therefore characterize conditions for the constrained set of classifiers that can guarantee consistency of hinge risk minimizing classifiers. Exploiting our theoretical results, we develop robust and computationally attractive hinge loss based procedures for a monotone classification problem.
日時
2022年10月21日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

■ Zoomを利用したオンライン開催について (Online Seminars Using Zoom)
今回のワークショップはZoomを利用してオンラインで開催されます。 ZoomのURLについてはシラバスでご確認下さい。
事前に、ご利用の端末にZoomアプリケーションのインストールをお済ませください。
■ 大学院生は出席をとりますので,学生証番号と名前をチャットで送って下さい。

※ 東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
中島 上智(一橋大学)
"High-frequency realized stochastic volatility model with the generalized hyperbolic skew Student's t-distribution"

Abstract The high-frequency stochastic volatility model is fit to intraday returns assuming that the intraday volatility consists of the autoregressive process, the seasonal component of the intraday volatility pattern, and the announcement component responding to macroeconomic announcements. The high-frequency realized stochastic volatility model augments the high-frequency stochastic volatility model with the daily realized volatility by taking account of the bias in the daily realized volatility caused by microstructure noise and non-trading hours. This article extends the high-frequency realized stochastic volatility model such that the return distribution follows the generalized hyperbolic (GH) skew Student's t-distribution. A Bayesian method using an efficient Markov chain Monte Carlo is developed for the analysis of the proposed model. The application to tail risk management such as Value-at-Risk (VaR) and expected shortfall (ES) is provided using the 5-minute returns of S&P 500 E-mini futures.
日時
2022年11月18日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
澤田 真行(一橋大学)
"Manipulation-Robust Regression Discontinuity Designs"

Abstract We propose a new identification condition for regression discontinuity designs. Our condition is explicit in the manipulation of the running variable. With this condition, we provide the first auxiliary restriction for the null hypothesis of McCrary (2008)’s diagnostic test implying identification. Furthermore, with the same auxiliary restriction, we provide alternative justifications for the partial identification result of Gerard, Rokkanen, and Rothe (2020) and detailed interpretations of their target parameters. Consequently, our proposed design is robust against manipulations in its capability to detect and bound them.
日時
2022年12月2日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
橋本 真太郎(広島大学)
"A new class of global-local shrinkage priors on gamma-distributed observations"

Abstract 生存時間や故障時間,平均所得などの正値データは応用上重要である.特に,ある程度高次元の正値データはその多くがある基準値の周りに集中していて,少数のデータはその基準値よりも大きな値をとるようなスパース性をもつことがある.スパースな信号解析の研究は実数値データや計数データに対しては多くあるものの,正値データに対してはほとんど研究がなされていない現状である.本研究では,正値データに対する統計モデルとしてガンマ列モデルを考え,その平均母数に対する逆ガンマ事前分布の形状尺度混合の形で構成される新たな縮小事前分布のクラスを提案する.また,事後分布の計算方法として,効率的なマルコフ連鎖モンテカルロアルゴリズムを提案し,縮小に関する理論的な性質についても示す.最後に,2020年初旬の韓国におけるCOVID-19患者の平均入院期間に関するデータへの応用を紹介する.また時間があれば,ガンマ分布に関連する最近の研究成果についても紹介する.
日時
2022年12月9日(金 Friday) 16:50-18:35

(Seminar Cancelled) 本講演はキャンセルになりました。
報告
廣瀬 雅代(九州大学)
"Small Area Inference under Area level Model for Bringing Several Desired Properties"

Abstract The area-level model has played an essential role in the theory and application of small-area estimation. An empirical best linear unbiased predictor (EBLUP) can contribute to gaining efficiency, especially when the sample size within each area is not large enough to make reliable direct estimates. Moreover, assessing its mean squared prediction error in small area inference is important. In this talk, we will introduce our proposed methods for bringing certain EBLUP's desired properties. Some are joint works with Prof. Partha Lahiri at the University of Maryland.
日時
2022年12月14日(水 Wednesday) 9:00-10:45 ※曜日と時間にご注意ください。
場所

【臨時応用統計ワークショップ】オンライン開催

■ Zoomを利用したオンライン開催について (Online Seminars Using Zoom)
今回のワークショップはZoomを利用してオンラインで開催されます。 ZoomのURLについてはシラバスでご確認下さい。
事前に、ご利用の端末にZoomアプリケーションのインストールをお済ませください。

※ 東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
Yoon-Jin Lee (Kansas State University)
"Instrumental Variables Estimation for Infinite Order Panel Autoregressive Processes"

Abstract This paper considers instrumental variables estimations of a possibly infinite order dynamic panel autoregressive (AR) process with individual effects. The estimation is based on the sieve AR approximation with its lag order increasing with the sample size. Transforming the variable to eliminate individual effects generates an endogeneity problem, particularly when the time series is short and instrumental variables approaches are useful to obtain well-behaved estimates in panels with large cross section. We establish the consistency and asymptotic normality of the instrumental variables estimators including the Anderson–Hsiao estimator, the generalized method of moments estimator and the double filter instrumental variables estimator. The asymptotic results are obtained using double asymptotics under which both the cross-sectional sample size and the length of time series tend to infinity. The finite sample performance of the estimators are examined through Monte Carlo simulations.
日時
2022年12月16日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
星野 匡郎(早稲田大学)
"Randomization Tests for the Specification of Interference Structure"

Abstract This paper considers testing for the specification of spillover effects in causal inference. We focus on experimental settings in which the treatment assignment mechanism is known to researchers. Considering the cases of perfect and imperfect compliance separately, we develop new randomization tests for both cases utilizing a hierarchical relationship between different exposures. Compared with the existing approaches, ours is applicable essentially to any null exposure specifications and produces powerful test statistics without a priori knowledge of the true interference structure. As empirical illustrations, we revisit two existing social network experiments: one on farmers' insurance adoption and the other on anti-conflict education programs.
日時
2022年12月23日(金 Friday) 16:50-18:35
場所 東京大学大学院経済学研究科 学術交流棟 (小島ホール)1階 第1セミナー室
in Seminar Room 1 on the 1st floor of the Economics Research Annex (Kojima Hall) [MAP]

※ 対面のみでの開催となります。東京大学外の方で参加をご希望の場合は、CIRJE (cirje[at mark]e.u-tokyo.ac.jp) までご連絡下さい。

報告
粟屋 直(Stanford University)
"Tree-based methods for learning probability distributions"

Abstract Learning probability distributions is a fundamental inferential task in statistics but challenging if a data distribution of our interest is complicated and high-dimensional. Addressing this challenging problem is the main topic of this talk, and we present two types of new tree-based methods: a single-tree method and an ensemble method. The new single-tree method, the first topic, is introduced by constructing a generalized Polya tree process, that is, a new Bayesian non-parametric model equipped with a new flexible tree prior. With this new prior we can find trees that represent the distributional structures well, and the tree space is efficiently explored with a new sequential Monte Carlo algorithm. The new ensemble method discussed, the second topic, is proposed under a new addition rule defined for probability distributions. The new rule based on cumulative distribution functions and their generalizations enables us to smoothly introduce a new efficient boosting algorithm, inheriting the important notions such as “residuals” and “zeros”. If time allows, recent research related to the ensemble method also will be presented.

 

[ English Top ]