
Kudo Shuhei
Department of Computer and Network Engineering | Assistant Professor |
Cluster I (Informatics and Computer Engineering) | Assistant Professor |
Researcher Information
Career
Educational Background
- 01 Oct. 2015 - 23 Mar. 2018
The University of Electro-Communications, 大学院 情報理工学研究科, 情報・通信工学専攻, Japan - 01 Apr. 2013 - 25 Mar. 2015
Kobe University, Graduate School of System Infomatics, Department of Computational Science, Japan - 01 Apr. 2009 - 25 Mar. 2013
Kobe University, 工学部, Department of Computer Science and Systems Engineering, Japan
Research Activity Information
Award
- Aug. 2021
日本応用数理学会
荻田・相島の固有ベクトル反復改良法に基づく実対称行列の固有値分解追跡手法
日本応用数理学会論文賞 応用部門, 白間 久瑠美;工藤 周平;山本 有作
Japan society, Japan - Mar. 2021
理化学研究所
Ohbu Research Incentive Award, Kudo Shuhei
Others - Jan. 2019
HPCS Asia 2019 Organization Committee
Best Paper Award, Shuhei Kudo;Toshiyuki Imamura
International society - Jun. 2016
IEEE Computer Society Tokyo/Japan Joint Chapter
Xeon PhiにおけるDSYRKの並列化手法と性能解析
HPCS IEEE Computer Society Japan Chapter 優秀若手研究賞
Japan society
Paper
- Comparison of Two QUBO Formulations of Approximate Block Diagonalization and Their Performance on the D-Wave Advantage Quantum Annealing Machine
Koushi Teramoto; Shuhei Kudo; Yusaku Yamamoto
Lecture Notes in Computer Science, Springer Nature Switzerland, 217-230, 01 Apr. 2025, Peer-reviwed
In book, English - Complex Palais matrix and a new unitary transform with bounded component norms
Shuhei Kudo
Lead, Special Matrices, Walter de Gruyter GmbH, 12, 1, 17 Sep. 2024, Peer-reviwed, Abstract
The Palais matrix represents an n n -dimensional rotation between two vectors that is functionally equivalent to the Householder reflection. This study introduces a one-parameter family of unitary transforms, termed the θ \theta transform, which encompasses the transform by the Palais matrix, the Householder reflection, and their unitary extensions. Furthermore, we define the θ ∠ {\theta }_{\angle } transform, a variant of the θ \theta transform featuring bounded component norms. It is demonstrated that the θ ∠ {\theta }_{\angle } transform is computationally efficient and backward stable when one of the vectors has the “one-hot” structure, making it highly valuable for matrix decompositions such as the QR decomposition. In addition, the θ \theta transform exhibits additional characteristics, including its convergence to the identity and the rowwise structure of its backward error.
Scientific journal - 二重指数関数型数値積分公式に基づく行列符号関数計算法の改良と性能評価
宮下 朋也; 工藤 周平; 山本 有作
日本応用数理学会論文誌, 34, 3, 66-97, Sep. 2024, Peer-reviwed
Scientific journal - 超並列データ駆動科学アプリケーションの自動高速化技術
星 健夫; 岩本 晴道; 寺地 雄真; 中野 陽斗; 工藤 周平
研究報告ハイパフォーマンスコンピューティング(HPC), 2024-HPC-193, 27, 1-8, Mar. 2024
Symposium, Japanese - A fast and efficient computation method for reflective diffraction simulations
Shuhei Kudo; Yusaku Yamamoto; Takeo Hoshi
Computer Physics Communications, Elsevier BV, 296, 109029-109029, Mar. 2024
Scientific journal - Approximate Block Diagonalization of Symmetric Matrices Using Quantum Annealing
Koushi Teramoto; Masaki Kugaya; Shuhei Kudo; Yasuhiko Takenaga; Yusaku Yamamoto
Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region, ACM, 8, 47-54, 18 Jan. 2024, Peer-reviwed
International conference proceedings, English - Automatic performance tuning using the ATMathCoreLib tool: Two experimental studies related to dense symmetric eigensolvers
Masato Kobayashi; Yusuke Hirota; Shuhei Kudo; Takeo Hoshi; Yusaku Yamamoto
Concurrency and Computation: Practice and Experience, Wiley, 30 Jun. 2023, Summary
We consider automatic performance tuning of dense symmetric eigenvalue problems using ATMathCoreLib, which is a library to assist automatic tuning. We deal with two problems, namely, automatic code selection for the symmetric generalized eigenvalue problem in distributed‐memory parallel environments and automatic parameter tuning in tridiagonalization of dense symmetric matrices on multicore processors. As for the first problem, numerical experiments show that ATMathCoreLib can choose the fastest solver for a given computing environment and problem size quickly even if the fluctuation in the execution time is as high as 40%. As for the second problem, ATMathCoreLib was able to select nearly optimal combinations of the algorithm and its parameter reliably and efficiently for various computing environments and matrix sizes. The performance of auto‐tuning was further enhanced by incorporating a user‐provided execution‐time model into ATMathCoreLib.
Scientific journal - Automatic Code Selection for the Dense Symmetric Generalized Eigenvalue Problem Using ATMathCoreLib
Masato Kobayashi; Shuhei Kudo; Takeo Hoshi; Yusaku Yamamoto
Parallel Processing and Applied Mathematics, Springer International Publishing, 453-463, 28 Apr. 2023, Peer-reviwed
International conference proceedings - Error analysis of the Cholesky QR-based block orthogonalization process for the one-sided block Jacobi SVD algorithm
Shuhei Kudo; Yusaku Yamamoto; Toshiyuki Imamura
Computing and Informatics, 39, 1203-1228, 20 May 2021, Peer-reviwed
Scientific journal, English - Implementation and Numerical Techniques for One EFlop/s HPL-AI Benchmark on Fugaku
Shuhei Kudo; Keigo Nitadori; Takuya Ina; Toshiyuki Imamura
2020 IEEE/ACM 11th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA), 2020, ScalA, 69-76, 13 Nov. 2020, Peer-reviwed
International conference proceedings, English - A 1024-member ensemble data assimilation with 3.5-km mesh global weather simulations
Hisashi Yashiro; Koji Terasaki; Yuta Kawai; Shuhei Kudo; Takemasa Miyoshi; Toshiyuki Imamura; Kazuo Minami; Hikaru Inoue; Tatsuo Nishiki; Takayuki Saji; Masaki Satoh; Hirofumi Tomita
2020 SC20: International Conference for High Performance Computing, Networking, Storage and Analysis (SC), 1, 1-10, 09 Nov. 2020, Peer-reviwed
International conference proceedings, English - A parallelizable energy-preserving integrator MB4 and its application to quantum-mechanical wavepacket dynamics
Tsubasa Sakai; Shuhei Kudo; Hiroto Imachi; Yuto Miyatake; Takeo Hoshi; Yusaku Yamamoto
Japan Journal of Industrial and Applied Mathematics, 38, 1, 105-123, 22 Jul. 2020, Peer-reviwed
Scientific journal, English - While Paper from Workshop on Large-scale Parallel Numerical Computing Technology (LSPANC 2020): HPC and Computer Arithmetic toward Minimal-Precision Computing
Roman Iakymchuk; Daichi Mukunoki; Artur Podobas; Fabienne Jézéquel; Toshiyuki Imamura; Norihisa Fujita; Jens Huthmann; Shuhei Kudo; Yiyu Tan; Jens Domke; Kai Torben Ohlhus; Takeshi Fukaya; Takeo Hoshi; Yuki Murakami; Maho Nakata; Takeshi Ogita; Kentaro Sano; Taisuke Boku
CoRR, abs/2004.04628, 2020
Scientific journal - 高い演算密度をもつヤコビ回転カーネルの構成手法
工藤周平; 今村俊幸
研究報告ハイパフォーマンスコンピューティング (HPC), 2019, 20, 1-9, 26 Feb. 2019
Symposium, Japanese - Cache-efficient implementation and batching of tridiagonalization on manycore CPUs
Shuhei Kudo; Toshiyuki Imamura
Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region, 71-80, 14 Jan. 2019, Peer-reviwed
International conference proceedings, English - 荻田・相島の固有ベクトル反復改良法に基づく実対称行列の固有値分解追跡手法
白間 久瑠美; 工藤 周平; 山本 有作
日本応用数理学会論文誌, 29, 1, 78-120, 2019, Peer-reviwed
Scientific journal, Japanese - 三重対角化におけるメニーコア環境に適した同期手法
工藤周平; 今村俊幸
研究報告ハイパフォーマンスコンピューティング (HPC), 2018, 33, 1-8, 23 Jul. 2018
Symposium, Japanese - On Using the Cholesky QR Method in the Full-Blocked One-Sided Jacobi Algorithm
Shuhei Kudo; Yusaku Yamamoto
Parallel Processing and Applied Mathematics. PPAM 2017. Lecture Notes in Computer Science, 10777, 612-622, 23 Mar. 2018, Peer-reviwed
International conference proceedings, English - Performance of the parallel block Jacobi method with dynamic ordering for the symmetric eigenvalue problem
Shuhei Kudo; Kousuke Yasuda; Yusaku Yamamoto
JSIAM Letters, 10, 41-44, 2018, Peer-reviwed
Scientific journal, English - Probabilistic analysis of an estimator for the Frobenius norm of a matrix product
Yusaku Yamamoto; Shuhei Kudo
JSIAM Letters, 9, 9-12, 2017, Peer-reviwed
Scientific journal, English - Performance analysis and optimization of the parallel one‐sided block Jacobi SVD algorithm with dynamic ordering and variable blocking
Shuhei Kudo; Yusaku Yamamoto; Martin Bečka; Marian Vajtersic
Concurrency and Computation: Practice and Experience, 29, 9, e4059, 23 Dec. 2016, Peer-reviwed
Scientific journal, English - Xeon Phi における DSYRK の並列化手法と性能解析
工藤周平; 山本有作
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集, 2016, 27-36, 30 May 2016, Peer-reviwed
Symposium, Japanese - Xeon Phi における DSYRK のスレッド並列化手法
工藤周平; 山本有作
研究報告ハイパフォーマンスコンピューティング (HPC), 2015, 17, 1-8, 09 Dec. 2015
Symposium, Japanese - Multiscale universal interface: a concurrent framework for coupling heterogeneous solvers
Yu-Hang Tang; Shuhei Kudo; Xin Bian; Zhen Li; George Em Karniadakis
Journal of Computational Physics, 297, 13-31, 15 Sep. 2015, Peer-reviwed
Scientific journal, English - Performance of the parallel one-sided block Jacobi SVD algorithm on a modern distributed-memory parallel computer
Shuhei Kudo; Yusaku Yamamoto; Martin Bečka; Marian Vajteršic
Parallel Processing and Applied Mathematics. PPAM 2015. Lecture Notes in Computer Science, 9573, 594-604, 06 Sep. 2015, Peer-reviwed
International conference proceedings, English - 三重対角化に対する Dongarra-Wilkinson 法の性能解析と実装手法について
工藤周平; 山本有作; 横川三津夫
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集, 2015, 19-28, 12 May 2015, Peer-reviwed
Symposium, Japanese - Convergence analysis of the parallel classical block Jacobi method for the symmetric eigenvalue problem
Yusaku Yamamoto; Zhang Lan; Shuhei Kudo
JSIAM Letters, 6, 57-60, 2014, Peer-reviwed
Scientific journal, English
Lectures, oral presentations, etc.
- ループブロッキングによるQR法におけるVanZeeらのヒュージング手法の最適化手法
彭 智勇; 工藤 周平
Oral presentation, 第198回ハイパフォーマンスコンピューティング・第14回量子ソフトウェア合同研究発表会
19 Mar. 2025
17 Mar. 2025- 19 Mar. 2025 - Comparison of Two QUBO Formulations of Approximate Block Diagonalization and Their Performance on the D-Wave Advantage Quantum Annealing Machine
Koushi Teramoto; Shuhei Kudo; Yusaku Yamamoto
Oral presentation, 15th International Conference on Parallel Processing & Applied Mathematics, Peer-reviewed
10 Sep. 2024
08 Sep. 2024- 11 Sep. 2024 - 行列関数近似を用いた対称行列逆数平方根関数計算の高速化
工藤周平
Oral presentation, 2024年並列/分散/協調処理に関するサマー・ワークショップ(SWoPP 2024)
09 Aug. 2024
07 Aug. 2024- 09 Aug. 2024 - データ駆動科学ソフトウェア・表面解析シミュレーションの高速化技術研究
工藤 周平; 星 健夫; 寺地 雄真; 須田 将成; 中野 陽斗; 谷田 秀哉; 長井 元輝
Poster presentation, JHPCN: 学際大規模情報基盤共同利用・共同研究拠点 第16回 シンポジウム
11 Jul. 2024
11 Jul. 2024- 12 Jul. 2024 - 陽電子回折シミュレーションの高速化
工藤周平
Oral presentation, 研究会「数理科学・プラズマ科学・物質科学の共通研究拠点形成」
20 May 2024
20 May 2024- 21 May 2024 - ポピュレーションアニーリング法による期待値計算と分配関数計算
山本 有作; 佐藤 涼太; 工藤 周平; 星 健夫
Invited oral presentation, RIMS共同研究(公開型) 新時代における高性能科学技術計算法の探究, Invited
20 Oct. 2023
18 Oct. 2023- 20 Oct. 2023 - 富岳でのポピュレーションアニーリングモンテカルロ法を用いたベイズ推定:先端量子ビーム計測への応用
星 健夫; 望月 出海; 吉見 一慶; 本山 裕一; 福島 孝治; 岩本 晴道; 木下 直希; 中野 陽斗; 寺地 雄真; 工藤 周平; 山本 有作
Invited oral presentation, RIMS共同研究(公開型) 新時代における高性能科学技術計算法の探究, Invited
19 Oct. 2023
18 Oct. 2023- 20 Oct. 2023 - Approximate block diagonalization of symmetric matrices using a quantum annealing
Koshi Teramoto; Masaki Kugaya; Shuhei Kudo; Yusaku Yamamoto
Oral presentation, 10th International Congress on Industrial and Applied Mathematics
24 Aug. 2023
20 Aug. 2023- 25 Aug. 2023 - Computing the matrix sign function with the double exponential formula
Tomoya Miyashita; Shuhei Kudo; Yusaku Yamamoto
Oral presentation, 10th International Congress on Industrial and Applied Mathematics
23 Aug. 2023
20 Aug. 2023- 25 Aug. 2023 - Application Optimization and Scalability of NICAM-LETKF on Fugaku
Hisashi Yashiro; Koji Terasaki; Yuta Kawai; Shuhei Kudo; Takemasa Miyoshi; Toshiyuki Imamura; Masuo Nakano; Chihiro Kodama; Masaki Satoh; Hirofumi Tomita
Oral presentation, The Platform for Advanced Scientific Computing Conference
26 Jun. 2023
26 Jun. 2023- 28 Jun. 2023 - 二重指数関数型数値積分公式を用いた行列符号関数計算法の精度および並列性の検証
宮下朋也; 山本有作; 工藤周平
Oral presentation, 日本応用数理学会 2023年研究部会連合発表会
10 Mar. 2023
08 Mar. 2023- 10 Mar. 2023 - 2本のベクトルが張る平面上での回転による直交変換
森 健太; 山本 有作; 工藤 周平
Oral presentation, 日本応用数理学会 2023年研究部会連合発表会
10 Mar. 2023
08 Mar. 2023- 10 Mar. 2023 - TRHEPD順問題計算における分割法の適用
工藤周平; 山本有作; 星建夫
Oral presentation, Japanese, RIMS共同研究 (公開型) 数値解析が拓く次世代情報社会~エッジから富岳まで~, Invited, Domestic conference
14 Oct. 2022 - パック化を陽に扱うタイル型行列計算について
Oral presentation, Japanese, 第185回ハイパフォーマンスコンピューティング研究発表会, Domestic conference
28 Jul. 2022 - Challenges of high-resolution large-ensemble data assimilation on supercomputer Fugaku
Hisashi Yashiro; Yuta Kawai; Koji Terasaki; Shuhei Kudo; Takemasa Miyoshi; Toshiyuki Imamura; Kazuo Minami; Masuo Nakano; Chihiro Kodama; Satoh Masaki; Hirofumi Tomita
Oral presentation, English, AGU Fall Meeting 2020, https://www.agu.org/fall-meeting, International conference
08 Dec. 2020 - A 1024-Member Ensemble Data Assimilation with 3.5-Km Mesh Global Weather Simulations
Hisashi Yashiro; Koji Terasaki; Yuta Kawai; Shuhei Kudo; Takemasa Miyoshi; Toshiyuki Imamura; Kazuo Minami; Hikaru Inoue; Tatsuo Nishiki; Takayuki Saji; Masaki Satoh; Hirofumi Tomita
Oral presentation, English, 2020 SC20: International Conference for High Performance Computing, Networking, Storage and Analysis (SC), https://sc20.supercomputing.org/, International conference
19 Nov. 2020 - Prompt report on Exa-scale HPL-AI benchmark
Shuhei Kudo; Keigo Nitadori; Takuya Ina; Toshiyuki Imamura
Poster presentation, English, 2020 IEEE International Conference on Cluster Computing (CLUSTER), https://clustercomp.org/2020/, International conference
15 Sep. 2020 - HPL-AI 行列の観察とベンチマークプログラムの実装について
工藤周平; 似鳥啓吾; 今村俊幸; 伊奈 拓也
Oral presentation, Japanese, 日本応用数理学会 2020 年度 年会, https://annual2020.jsiam.org/, Domestic conference
08 Sep. 2020 - A Level-3 BLAS Like Kernel of the Jacobi Rotations for the Jacobi’s Eigenvalue Algorithm
Shuhei Kudo; Toshiyuki Imamura
Oral presentation, English, ParNum 2019, the 13th workshop in the series of the "Parallel Numerics" workshops, https://www.fsb.unizg.hr/parnum2019/index.html, International conference
28 Oct. 2019 - ヤコビ回転カーネルを用いたヤコビ固有値計算手法の性能評価
工藤 周平; 今村 俊幸
Oral presentation, Japanese, 第170回ハイパフォーマンスコンピューティング研究発表会(SWoPP2019), http://www.ipsj.or.jp/kenkyukai/event/hpc170.html, Domestic conference
26 Jul. 2019 - 高い演算密度をもつヤコビ回転カーネルの構成手法
工藤 周平; 今村 俊幸
Oral presentation, Japanese, 第168回ハイパフォーマンスコンピューティング研究発表会, https://www.ipsj.or.jp/kenkyukai/event/hpc168.html, Domestic conference
07 Mar. 2019 - Cache-efficient implementation and batching of tridiagonalization on manycore CPUs
Shuhei Kudo; Toshiyuki Imamura
Oral presentation, English, HPCAsia 2019 International Conference on High Performance Computing in Asia-Pacific Region, http://hpcasia2019.org/index-2.html, International conference
15 Jan. 2019 - 三重対角化におけるメニーコア環境に適した同期手法
工藤 周平; 今村 俊幸
Oral presentation, Japanese, 第165回ハイパフォーマンスコンピューティング研究発表会(SWoPP2018), http://www.ipsj.or.jp/kenkyukai/event/hpc165.html, Domestic conference
31 Jul. 2018 - On using the Cholesky QR method for the full-blocked one-sided Jacobi algorithm
S. Kudo; Y. Yamamoto
Oral presentation, English, 12TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING AND APPLIED MATHEMATICS, https://ppam.edu.pl/prev/ppam2017/, International conference
11 Sep. 2017 - Cholesky QR法を用いたブロック片側ヤコビ法の誤差解析
工藤周平; 山本有作
Oral presentation, Japanese, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第23回研究会, https://na.cs.tsukuba.ac.jp/mepa/?page_id=1303, Domestic conference
27 Jul. 2017 - Xeon Phiに対する対称行列積DSYRKの高性能実装
工藤周平; 山本有作; 星健夫
Oral presentation, Japanese, 第2回CDMSI(ポスト「京」重点課題(7))研究会, https://post-k.cms-initiative.jp/EVENTS/SYMPO2-3.HTM, Domestic conference
12 Jul. 2017 - 片側ヤコビSVDの並列計算機向け実装と性能解析
工藤周平; 山本有作
Oral presentation, Japanese, 日本応用数理学会2017年 研究部会連合発表会, Domestic conference
06 Mar. 2017 - High-performance Parallelization Method of DSYRK for SVD and other matrix computations on Xeon Phi
S. Kudo; Y. Yamamoto
Oral presentation, English, THE 9TH INTERNATIONAL WORKSHOP ON PARALLEL MATRIX ALGORITHMS AND APPLICATIONS, https://pmaa16.sciencesconf.org/index.html, International conference
07 Jul. 2016 - Xeon PhiにおけるDSYRKの並列化手法と性能解析
工藤周平; 山本有作
Oral presentation, Japanese, 2016年ハイパフォーマンスコンピューティングと計算科学シンポジウム, 一般社団法人情報処理学会 ハイパフォーマンスコンピューティング研究会, Domestic conference
06 Jun. 2016 - Xeon PhiにおけるDSYRKのスレッド並列化手法
工藤周平; 山本有作
Oral presentation, Japanese, 第152回HPC研究発表会, https://www.ipsj.or.jp/kenkyukai/event/hpc152.html, Domestic conference
17 Dec. 2015 - Performance of parallel one-side block Jacobi SVD algorithm on a modern distributed-memory parallel computer
S. Kudo; Y. Yamamoto; M. Bečka; M. Varjteršic
Oral presentation, English, 11TH INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING AND APPLIED MATHEMATICS, International conference
08 Sep. 2015 - 三重対角化に対するDongarra-Wilkinson法の性能解析と実装手法について
工藤周平; 山本有作; 横川三津夫
Oral presentation, Japanese, 2015年ハイパフォーマンスコンピューティングと計算科学シンポジウム, 一般社団法人情報処理学会 ハイパフォーマンスコンピューティング研究会, 東京大学 武田先端知ビル5階 武田ホール, http://www.ipsj.or.jp/kenkyukai/event/s-hpcs2015.html, Domestic conference
19 May 2015 - ブロックヤコビ法に基づく固有理解法の超並列計算機上での実装
工藤周平; 高橋祐輔; 深谷猛; 山本有作
Oral presentation, Japanese, 日本応用数理学会 2013 年度年会, http://archive.jsiam.org/annual/2013/, Domestic conference
11 Sep. 2013
Courses
Research Themes
- 研究課題「超次元状態エンジニアリングによる未来予測型デジタルシステム」研究題目「Vラボ向け高速計算技術の開発」
科学技術振興機構, 戦略的な研究開発の推進 ムーンショット型研究開発事業, 自然科学研究機構, Others, 本プロジェクトでは、核融合反応を発電や様々な場面で利用するフュージョンエネルギーシステムの設計や性能試験をデジタル空間上で行えるデジタルプラットフォームおよびバーチャルラボラトリ(仮想実験室:Vラボ)を構築します。 デジタル空間上でフュージョンエネルギーシステムにおけるプラズマ(電離したガス)の状態や構成機器の複雑性と時空間スケール(時間的・空間的な広がり)を再現するために、時間軸・空間(座標)軸・速度軸・物理量などが組み合わされた「超次元データ空間」(図1)を新たに定義し、その特異な空間の特性を組み込んだ計算手法を確立します。さらに、その計算手法を「超次元状態エンジニアリング」として応用できるようにするために、これまでにない革新的AI/データ駆動科学技術を開発します。 これにより、フュージョンエネルギーシステムの実験をデジタル空間上で実施できるVラボを構築し、デジタル空間上での未来(次世代)のフュージョンエネルギーシステムの要素技術やシステム全体の性能予測(未来予測)を可能にします(図2)。本プロジェクトによって、リアル空間では多大な時間とコストを要する試行錯誤(試作機を開発し性能試験を行うこと)のプロセスを大幅に低減させることで、多様なフュージョンエネルギーシステムの早期の社会実装やコスト削減を実現し、フュージョンエネルギーが供給される社会を目指します。, JPMJMS24A3-7
Apr. 2025 - Mar. 2027 - データ科学計算フレームワーク ODAT-SE の高度化と高性能化
学際大規模情報基盤共同利用・共同研究拠点, 学際大規模情報基盤共同利用・共同研究拠点 公募型共同研究, Principal investigator, jh250034
Apr. 2025 - Mar. 2026 - データ駆動科学ソフトウェア・表面解析シミュレーションの高速化技術研究
工藤 周平; 星 健夫; 谷田 秀哉; 寺地 雄真; 須田 将成; 中野 陽斗; 長井 元輝
学際大規模情報基盤共同利用・共同研究拠点, 学際大規模情報基盤共同利用・共同研究拠点 公募型共同研究, Principal investigator, jh240039
Apr. 2024 - Mar. 2025 - 高いスケーリング性能と高精度性を併せ持つ次世代固有値・特異値分解ライブラリの開発
山本 有作
Oct. 2019 - Mar. 2023 - エクサ時代の非同期タスクを応用した高性能高次元数値線形代数の研究
今村 俊幸
2019 - 2021 - ブロックヤコビ法に基づく超並列環境に適した固有値・特異値計算手法の開発
工藤 周平
日本学術振興会, 科学研究費助成事業, 電気通信大学, 特別研究員奨励費, 本年度はブロックヤコビ法の理論的解析と実装手法の確立に取り組んだ。固有値分解のためのヤコビ法についてはこれまでの研究において一定の成果を上げているため、とくに誤差解析について新しい観点から研究を進めるため、特異値分解のためのヤコビ法について研究を進めた。 まず誤差解析について研究を進めた結果、特異値計算向けブロックヤコビ法が持つ誤差の構造を持った上限が得られた。この結果は、対称な行列積DSYRKを内部で使用するブロック化手法を用いた場合においても収束性に影響を与える誤差が小さくなるという完全な証明にはなっていないが、十分期待の持てる結果であった。一方でこの結果を得るには部分対角化のためにはより高速な他の手法ではなくヤコビ法を用いなければならないということがわかった。 また収束性の解析においては整列性との関連について解明できなかったが、古典的並列オーダリングという別の並列計算向けオーダリングにおいて、よりシャープな上限が得られた。整列性との関係が解明されなかったことは残念だが、古典的並列オーダリングは収束の速さにおいて整列性を持ったオーダリングと同等以上の性能を持つため、大目標である、大域収束性を持ちかつ収束の速い手法の開発には貢献できた。 この結果を基に特異値分解向けブロックヤコビ法の大規模並列環境向け実装の確立に取り組んだ。申請者は演算量の増加を許す代わりに並列計算において問題となる通信回数を削減するAllReduce型アルゴリズムを開発し、高い並列性能を得た。 一方、GPUについては、ヤコビ法を用いた部分対角化のGPU向け実装に取り組んだが、CPUとGPUの差異が大きく影響し、GPUの高い性能を活用できるまでには至らなかった。, 17J07747
26 Apr. 2017 - 31 Mar. 2019