山本 有作

情報・ネットワーク工学専攻教授
Ⅰ類(情報系)教授
先端工学基礎課程(夜間主課程)教授

研究キーワード

  • Parallel Computing
  • Eigenvalue Problems
  • Linear Simultaneous Equations
  • Numerical Linear Algebra
  • 並列計算
  • 連立1次方程式
  • 固有値
  • 線形計算

研究分野

  • 情報通信, 計算科学

委員歴

  • 2023年04月 - 現在
    編集委員, Japan Journal of Industrial and Applied Mathematics, 学協会
  • 2023年07月 - 2025年06月
    理事, 日本応用数理学会, 学協会

受賞

  • 受賞日 2021年09月
    日本応用数理学会, https://www2.jsiam.org/ronbun-bestauthor2021
    荻田・相島の固有ベクトル反復改良法に基づく実対称行列の固有値分解追跡手法
    論文賞, 白間久瑠美;工藤周平;山本有作
    国内学会・会議・シンポジウム等の賞, 日本国

論文

  • Comparison of Two QUBO Formulations of Approximate Block Diagonalization and Their Performance on the D-Wave Advantage Quantum Annealing Machine
    Koushi Teramoto; Shuhei Kudo; Yusaku Yamamoto
    Lecture Notes in Computer Science, Springer Nature Switzerland, 掲載ページ 217-230, 出版日 2025年04月01日, 査読付
    論文集(書籍)内論文
  • Discrete Lotka–Volterra systems with time delay and its stability analysis
    Yusaku Yamamoto; Taisei Yamamoto; Takumi Kuroiwa; Kurumi Oka; Emiko Ishiwata; Masashi Iwasaki
    筆頭著者, Physica D: Nonlinear Phenomena, Elsevier BV, 474巻, 掲載ページ 134562-134562, 出版日 2025年04月, 査読付
    研究論文(学術雑誌)
  • Convergence analysis of the generalized Newton shift for computing singular values with the dqds algorithm
    Kinji Kimura; Yusaku Yamamoto; Yusuke Hirota; Masami Takata; Takumi Yamashita; Yoshimasa Nakamura
    Japan Journal of Industrial and Applied Mathematics, Springer Science and Business Media LLC, 出版日 2025年03月03日, 査読付, Abstract

    The generalized Newton shift is a generalization of the Newton shift for computing the singular values of a bidiagonal matrix with the dqds or mdLVs algorithm and is defined as $$\left( \textrm{Tr}\left( \left( B^{(n)}\right) ^{\top } B^{(n)}\right) ^{-p}\right) ^{-1/p}$$ , where $$B^{(n)}$$ is the bidiagonal matrix at the n-th iteration and p is some positive integer. This quantity can be computed in O(pm) work, where m is the order of the matrix, and another $$O(p^2 m)$$ subtraction-free algorithm is also available for higher accuracy. We analyze the asymptotic convergence property of the dqds algorithm with the generalized Newton shift and show that its order of convergence is $$p+1-\epsilon $$ for any $$\epsilon >0$$ . This result is confirmed by numerical experiments. Since the generalized Newton shift can achieve arbitrarily high order of convergence, it should be useful as a building block for constructing an efficient shifting strategy for the dqds algorithm.
    研究論文(学術雑誌)
  • 二重指数関数型数値積分公式に基づく行列符号関数計算法の改良と性能評価
    宮下 朋也; 工藤 周平; 山本 有作
    責任著者, 日本応用数理学会論文誌, 34巻, 3号, 掲載ページ 66-97, 出版日 2024年09月, 査読付
    研究論文(学術雑誌)
  • q-discretization of the Kostant–Toda equation and its asymptotic analysis
    Ryoto Watanabe; Masato Shinjo; Yusaku Yamamoto; Masashi Iwasaki
    Transactions of Mathematics and Its Applications, Oxford University Press (OUP), 8巻, 2号, 出版日 2024年07月04日, 査読付, Abstract

    The famous Toda equation is an integrable system related to similarity transformations of tridiagonal matrices. The discrete Toda equation, which is a time-discretization of the Toda equation, is essentially the recursion formula of the quotient-difference (qd) algorithm for computing eigenvalues of tridiagonal matrices. Another time-discretization of the Toda equation is the $q$-discrete Toda equation, which is derived by replacing standard derivatives with the so-called $q$-derivatives that involves a parameter $q$ such that $0<q<1$. In a prior work, we related the $q$-discrete Toda equation to implicit-shift $LR$ transformations (which are similarity transformations) of tridiagonal matrices. Furthermore, we developed the determinantal solution to clarify the convergence as discrete-time goes to infinity. In this paper, we propose an extension of the $q$-discrete Toda equation as a time-discretization of the Kostant–Toda equation and then show the convergence as discrete-time goes to infinity from the perspective of implicit-shift $LR$ transformations of Hessenberg matrices. We also present numerical examples to verify the convergence as discrete-time goes to infinity in the proposed $q$-discrete Kostant–Toda equation.
    研究論文(学術雑誌)
  • A Cholesky QR type algorithm for computing tall-skinny QR factorization with column pivoting
    Takeshi Fukaya; Yuji Nakatsukasa; Yusaku Yamamoto
    2024 IEEE International Parallel and Distributed Processing Symposium (IPDPS), IEEE, 出版日 2024年05月27日, 査読付
    研究論文(国際会議プロシーディングス)
  • A fast and efficient computation method for reflective diffraction simulations
    Shuhei Kudo; Yusaku Yamamoto; Takeo Hoshi
    Computer Physics Communications, Elsevier BV, 296巻, 掲載ページ 109029-109029, 出版日 2024年03月, 査読付
    研究論文(学術雑誌)
  • Approximate Block Diagonalization of Symmetric Matrices Using Quantum Annealing
    Koushi Teramoto; Masaki Kugaya; Shuhei Kudo; Yasuhiko Takenaga; Yusaku Yamamoto
    Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region, ACM, 出版日 2024年01月18日, 査読付
    研究論文(国際会議プロシーディングス)
  • Roundoff error analysis of the double-exponential formula-based method for the matrix sign function
    Tomoya Miyashita; Shuhei Kudo; Yusaku Yamamoto
    JSIAM Letters, The Japan Society for Industrial and Applied Mathematics, 16巻, 掲載ページ 13-16, 出版日 2024年, 査読付
    研究論文(学術雑誌)
  • Box and ball system with numbered boxes and balls
    Yusaku Yamamoto; Akiko Fukuda; Emiko Ishiwata; Masashi Iwasaki
    筆頭著者, RIMS Kokyuroku Bessatsu, B94巻, 1号, 掲載ページ 21-36, 出版日 2023年11月, 査読付
    研究論文(学術雑誌), 英語
  • Automatic performance tuning using the ATMathCoreLib tool: Two experimental studies related to dense symmetric eigensolvers
    Masato Kobayashi; Yusuke Hirota; Shuhei Kudo; Takeo Hoshi; Yusaku Yamamoto
    Concurrency and Computation: Practice and Experience, Wiley, 出版日 2023年06月30日, 査読付, Summary

    We consider automatic performance tuning of dense symmetric eigenvalue problems using ATMathCoreLib, which is a library to assist automatic tuning. We deal with two problems, namely, automatic code selection for the symmetric generalized eigenvalue problem in distributed‐memory parallel environments and automatic parameter tuning in tridiagonalization of dense symmetric matrices on multicore processors. As for the first problem, numerical experiments show that ATMathCoreLib can choose the fastest solver for a given computing environment and problem size quickly even if the fluctuation in the execution time is as high as 40%. As for the second problem, ATMathCoreLib was able to select nearly optimal combinations of the algorithm and its parameter reliably and efficiently for various computing environments and matrix sizes. The performance of auto‐tuning was further enhanced by incorporating a user‐provided execution‐time model into ATMathCoreLib.
    研究論文(学術雑誌)
  • Automatic Code Selection for the Dense Symmetric Generalized Eigenvalue Problem Using ATMathCoreLib
    Masato Kobayashi; Shuhei Kudo; Takeo Hoshi; Yusaku Yamamoto
    Parallel Processing and Applied Mathematics, Springer International Publishing, 掲載ページ 453-463, 出版日 2023年04月28日, 査読付
    論文集(書籍)内論文
  • Discrete relativistic Toda equation from the perspective of shifted transformation
    Yusaku Yamamoto; Naoya Minoshita; Masashi Iwasaki
    筆頭著者, Physica D, 440巻, 1号, 掲載ページ 133485-133493, 出版日 2022年08月02日, 査読付
    研究論文(学術雑誌), 英語
  • Convergence to Singular Triplets in the Two-Sided Block-Jacobi SVD Algorithm with Dynamic Ordering
    Gabriel Okša; Yusaku Yamamoto; Marián Vajteršic
    SIAM Journal on Matrix Analysis and Applications, 45巻, 3号, 掲載ページ 1238-1262, 出版日 2022年08月01日, 査読付
    研究論文(学術雑誌), 英語
  • Discrete hungry integrable systems — 40 years from the Physica D paper by W.W. Symes
    Masato Shinjo; Akiko Fukuda; Koichi Kondo; Yusaku Yamamoto; Emiko Ishiwata; Masashi Iwasaki; Yoshimasa Nakamura
    Physica D, 439巻, 1号, 掲載ページ 133422-133435, 出版日 2022年06月23日, 査読付
    研究論文(学術雑誌), 英語
  • Box and Ball System with Numbered Boxes
    Yusaku Yamamoto; Akiko Fukuda; Sonomi Kakizaki; Emiko Ishiwata; Masashi Iwasaki; Yoshimasa Nakamura
    Mathematical Physics, Analysis and Geometry, Springer, 25巻, 1号, 掲載ページ 1-20, 出版日 2022年04月24日, 査読付
    研究論文(学術雑誌), 英語
  • Error analysis of the truncated Taylor series expansion method for computing matrix exponential
    Yusaku Yamamoto; Shuhei Kudo; Takeo Hoshi
    JSIAM Letters, The Japan Society for Industrial and Applied Mathematics, 14巻, 掲載ページ 147-150, 出版日 2022年, 査読付
    研究論文(学術雑誌)
  • Performance prediction of massively parallel computation by Bayesian inference
    Hisashi Kohashi; Harumichi Iwamoto; Takeshi Fukaya; Yusaku Yamamoto; Takeo Hoshi
    JSIAM Letters, The Japan Society for Industrial and Applied Mathematics, 14巻, 掲載ページ 13-16, 出版日 2022年, 査読付
    研究論文(学術雑誌)
  • Combinatorial preconditioning for accelerating the convergence of the parallel block Jacobi method for the symmetric eigenvalue problem
    Masaki Kugaya; Shuhei Kudo; Yusaku Yamamoto
    JSIAM Letters, 13巻, 1号, 掲載ページ 56-59, 出版日 2021年09月26日, 査読付
    研究論文(学術雑誌), 英語
  • Acceleration and Parallelization of a Linear Equation Solver for Crack Growth Simulation Based on the Phase Field Model
    Gaku Ishii; Yusaku Yamamoto; Takeshi Takaishi
    Mathematics, MDPI Publishing, 9巻, 18号, 掲載ページ 2248-2268, 出版日 2021年09月13日, 査読付
    研究論文(学術雑誌), 英語
  • On eigenvalues of a matrix arising in energy-preserving/dissipative continuous-stage Runge-Kutta methods
    Yusaku Yamamoto
    Special Matrices, De Gruyter, 10巻, 1号, 掲載ページ 34-39, 出版日 2021年08月10日, 査読付
    研究論文(学術雑誌), 英語
  • Block red–black MILU(0) preconditioner with relaxation on GPU
    Akemi Shioya; Yusaku Yamamoto
    Parallel Computing, Elsevier, 103巻, 1号, 掲載ページ 102760-102772, 出版日 2021年06月01日, 査読付
    研究論文(学術雑誌), 英語
  • Error analysis of the cholesky qr-based block orthogonalization process for the one-sided block Jacobi SVD algorithm
    Shuhei Kudo; Yusaku Yamamoto; Toshiyuki Imamura
    Computing and Informatics, Slovak Academy of Sciences, Institute of Theatre and Film Research of the Center for Research in Art, 39巻, 6号, 掲載ページ 1203-1228, 出版日 2021年05月01日, 査読付, The one-sided block Jacobi method (OSBJ) has attracted attention as a fast and accurate algorithm for the singular value decomposition (SVD). The computational kernel of OSBJ is orthogonalization of a column block pair, which amounts to computing the SVD of this block pair. Hari proposes three methods for this partial SVD, and we found through numerical experiments that the variant named “V2”, which is based on the Cholesky QR method, is the fastest variant and achieves satisfactory accuracy. While it is a good news from a practical viewpoint, it seems strange considering the well-known instability of the Cholesky QR method. In this paper, we perform a detailed error analysis of the V2 variant and explain why and when it can be used to compute the partial SVD accurately. Thus, our results provide a theoretical support for using the V2 variant safely in the OSBJ method.
    研究論文(学術雑誌), 英語
  • On convergence to eigenvalues and eigenvectors in the block-Jacobi EVD algorithm with dynamic ordering
    Yusaku Yamamoto; Gabriel Oksa; Marian Vajtersic
    Linear Algebra and its Applications, Elsevier, 622巻, 1号, 掲載ページ 19-45, 出版日 2021年03月01日, 査読付
    研究論文(学術雑誌), 英語
  • Convergence acceleration of the shifted LR transformations for totally nonnegative Hessenberg matrices, Applications of Mathematics
    Akiko Fukuda; Yusaku Yamamoto; Masashi Iwasaki; Emiko Ishiwata; Yoshimasa Nakamura
    Applications of Mathematics, 65巻, 5号, 掲載ページ 677-702, 出版日 2020年10月13日, 査読付, We design shifted LR transformations based on the integrable discrete hungry Toda equation to compute eigenvalues of totally nonnegative matrices of the banded Hessenberg form. The shifted LR transformation can be regarded as an extension of the extension employed in the well-known dqds algorithm for the symmetric tridiagonal eigenvalue problem. In this paper, we propose a new and effective shift strategy for the sequence of shifted LR transformations by considering the concept of the Newton shift. We show that the shifted LR transformations with the resulting shift strategy converge with order 2 − ε for arbitrary ε > 0.
    研究論文(学術雑誌), 英語
  • Fixed-point analysis of Ogita-Aishima’s symmetric eigendecomposition refinement algorithm for multiple eigenvalues
    K. Shiroma; Y. Yamamoto
    JSIAM Letters, 日本応用数理学会, 12巻, 1号, 掲載ページ 5-8, 出版日 2020年06月01日, 査読付
    研究論文(学術雑誌), 英語
  • Shifted Cholesky QR for Computing the QR Factorization of Ill-Conditioned Matrices.
    Takeshi Fukaya; Ramaseshan Kannan; Yuji Nakatsukasa; Yusaku Yamamoto; Yuka Yanagisawa
    SIAM J. Scientific Computing, 42巻, 1号, -503, 出版日 2020年, 査読付, The Cholesky QR algorithm is an efficient communication-minimizing algorithm

    for computing the QR factorization of a tall-skinny matrix. Unfortunately it

    has the inherent numerical instability and breakdown when the matrix is

    ill-conditioned. A recent work establishes that the instability can be cured by

    repeating the algorithm twice (called CholeskyQR2). However, the applicability

    of CholeskyQR2 is still limited by the requirement that the Cholesky

    factorization of the Gram matrix runs to completion, which means it does not

    always work for matrices $X$ with $\kappa_2(X)\gtrsim { { \bf u } }^{-\frac{1},{2 } }$

    where ${ { \bf u } }$ is the unit roundoff. In this work we extend the

    applicability to $\kappa_2(X)=\mathcal{O}({\bf u}^{-1})$ by introducing a shift

    to the computed Gram matrix so as to guarantee the Cholesky factorization

    $R^TR= A^TA+sI$ succeeds numerically. We show that the computed $AR^{-1}$ has

    reduced condition number $\leq { { \bf u } }^{-\frac{1},{2 } }$, for which CholeskyQR2

    safely computes the QR factorization, yielding a computed $Q$ of orthogonality

    $\|Q^TQ-I\|_2$ and residual $\|A-QR\|_F/\|A\|_F$ both $\mathcal{O}({ { \bf u } })$.

    Thus we obtain the required QR factorization by essentially running Cholesky QR

    thrice. We extensively analyze the resulting algorithm shiftedCholeskyQR to

    reveal its excellent numerical stability. shiftedCholeskyQR is also highly

    parallelizable, and applicable and effective also when working in an oblique

    inner product space. We illustrate our findings through experiments, in which

    we achieve significant (up to x40) speedup over alternative methods.
    研究論文(学術雑誌)
  • EigenKernel
    Kazuyuki Tanaka; Hiroto Imachi; Tomoya Fukumoto; Akiyoshi Kuwata; Yuki Harada; Takeshi Fukaya; Yusaku Yamamoto; Takeo Hoshi
    Japan Journal of Industrial and Applied Mathematics, Springer Science and Business Media LLC, 36巻, 2号, 掲載ページ 719-742, 出版日 2019年07月
    研究論文(学術雑誌)
  • Asymptotic Quadratic Convergence of the Two-Sided Serial and Parallel Block-Jacobi SVD Algorithm
    Gabriel Oksa; Yusaku Yamamoto; Martin Becka; Marian Vajtersic
    SIAM Journal on Matrix Analysis and Applications, Society for Industrial and Applied Mathematics, 40巻, 2号, 掲載ページ 639-671, 出版日 2019年05月23日, 査読付
    研究論文(学術雑誌), 英語
  • Efficient implementations of the modified Gram–Schmidt orthogonalization with a non-standard inner product
    Akira Imakura; Yusaku Yamamoto
    Japan Journal of Industrial and Applied Mathematics, 36巻, 2号, 掲載ページ 619-641, 出版日 2019年04月29日, 査読付
    研究論文(学術雑誌), 英語
  • EigenKernel: A middleware for parallel generalized eigenvalue solvers to attain high scalability and usability
    Kazuyuki Tanaka; Hiroto Imachi; Tomoya Fukumoto; Akiyoshi Kuwata; Yuki Harada; Takeshi Fukaya; Yusaku Yamamoto; Takeo Hoshi
    Japan Journal of Industrial and Applied Mathematics, 36巻, 2号, 掲載ページ 719-742, 出版日 2019年04月29日, 査読付
    研究論文(学術雑誌), 英語
  • 荻田・相島の固有ベクトル反復改良法に基づく実対称行列の固有値分解追跡手法
    白間久瑠美; 工藤周平; 山本有作
    日本応用数理学会論文誌, 29巻, 1号, 掲載ページ 78-120, 出版日 2019年03月25日, 査読付
    研究論文(学術雑誌), 日本語
  • On Using the shifted minimal residual method for quantum-mechanical wave packet simulation
    Hiroaki Seito; Takeo Hoshi; Yusaku Yamamoto
    JSIAM Letters, 11巻, 1号, 掲載ページ 13-16, 出版日 2019年03月05日, 査読付
    研究論文(学術雑誌), 英語
  • A case study on modeling the performance of dense matrix computation: Tridiagonalization in the EigenExa eigensolver on the K computer
    Takeshi Fukaya; Toshiyuki Imamura; Yusaku Yamamoto
    Proceedings of 2018 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW), IEEE, 1巻, 1号, 掲載ページ 1-1, 出版日 2018年08月06日, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Performance of the parallel block Jacobi method with dynamic ordering for the symmetric eigenvalue problem
    Shuhei Kudo; Kousuke Yasuda; Yusaku Yamamoto
    JSIAM Letters, 10巻, 1号, 掲載ページ 41-44, 出版日 2018年08月01日, 査読付
    研究論文(学術雑誌), 英語
  • Asymptotic quadratic convergence of the parallel block-Jacobi EVD algorithm with dynamic ordering for Hermitian matrices
    Gabriel Oksa; Yusaku Yamamoto; Marian Vajtersic
    BIT Numerical Mathematics, 0巻, 0号, 掲載ページ 0-0, 出版日 2018年05月01日, 査読付
    研究論文(学術雑誌), 英語
  • The danger of combining block red–black ordering with modified incomplete factorizations and its remedy by perturbation or relaxation
    Akemi Shioya; Yusaku Yamamoto
    Japan Journal of Industrial and Applied Mathematics, Springer, 35巻, 1号, 掲載ページ 195-216, 出版日 2018年03月01日, 査読付, Modified incomplete LU/Cholesky factorizations without fill-ins are popular preconditioners for Krylov subspace methods, because they require no extra memory and have more potential of accelerating the convergence than simple ILU/IC preconditioners. For parallelizing preconditioners, the block red–black ordering is attractive due to its highly parallel nature and small number of synchronization points. Hence, their combination seems to produce powerful and parallelizable preconditioners. In fact, however, this combination can cause breakdown of the factorization due to the occurrence of zero pivots. We analyze this phenomenon and give necessary and sufficient conditions of zero pivots in the case of a regular grid. We also show both theoretically and experimentally that adding perturbation to the diagonal elements or relaxing the compensation of dropped fill-ins is useful to alleviate the problem. Numerical tests show that the resulting preconditioners are highly effective and are applicable for up to 10 3 level of parallelism.
    研究論文(学術雑誌), 英語
  • On using the Cholesky QR method in the full-blocked one-sided Jacobi algorithm
    Shuhei Kudo; Yusaku Yamamoto
    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), Springer Verlag, 10777巻, 掲載ページ 612-622, 出版日 2018年, 査読付, The one-sided Jacobi method is known as an alternative of the bi-diagonalization based singular value decomposition (SVD) algorithms like QR, divide-and-conquer and MRRR, because of its accuracy and comparable performance. There is an extension of the one-sided Jacobi method called “full-blocked” method, which can further improve the performance by replacing level-1 BLAS like operations with matrix multiplications. The main part of the full-blocked one-sided Jacobi method (OSBJ) is computing the SVD of a pair of block columns of the input matrix. Thus, the computation method of this partial SVD is important for both accuracy and performance of OSBJ. Hari proposed three methods for this computation, and we found out that one of the method called “V2”, which computes the QR decomposition in this partial SVD using the Cholesky QR method, is the fastest and has comparable accuracy with other method. This is interesting considering that Cholesky QR is generally known as fast but unstable algorithm. In this article, we analyze the accuracy of V2 and explain why and when the Cholesky QR method used in it can compute the QR decomposition accurately. We also show the performance and accuracy comparisons with other computational methods.
    研究論文(国際会議プロシーディングス), 英語
  • One-way dissectionオーダリングによる連立一次方程式の直接解法の並列化
    中野 智輝; 横川 三津夫; 深谷 猛; 山本 有作
    情報処理学会第162回ハイパフォーマンスコンピューティング研究会, 情報処理学会, 2017-HPC-162巻, 19号, 掲載ページ 1-10, 出版日 2017年12月, 時間依存シュレディンガー方程式のモデル問題として2次元ポアソン方程式を取り上げ,one-way dissection オーダリングによる正定値対称疎行列を係数行列にもつ連立一次方程式の並列直接解法に対して,いくつかの疎行列格納方式を用いた場合の性能評価結果について述べる.また,新しいスカイライン格納方式を提案し,その有効性を確認した.
    研究論文(研究会,シンポジウム資料等), 日本語
  • Solution of a Nonlinear Eigenvalue Problem Using Signed Singular Values
    Ooi, Kouhei; Mizuno, Yoshinori; Sogabe, Tomohiro; Yamamoto, Yusaku; Zhang, Shao-Liang
    EAST ASIAN JOURNAL ON APPLIED MATHEMATICS, CAMBRIDGE UNIV PRESS, 7巻, 4号, 掲載ページ 799-809, 出版日 2017年11月, 査読付, We propose a robust numerical algorithm for solving the nonlinear eigenvalue problem A (lambda) x = 0. Our algorithmis based on the idea of finding the value of. forwhich A(lambda) is singular by computing the smallest eigenvalue or singular value of A(lambda) viewed as a constant matrix. To further enhance computational efficiency, we introduce and use the concept of signed singular value. Our method is applicable when A(lambda) is large and nonsymmetric and has strong nonlinearity. Numerical experiments on a nonlinear eigenvalue problem arising in the computation of scaling exponent in turbulent flow show robustness and effectiveness of our method.
    研究論文(学術雑誌), 英語
  • Asymptotic quadratic convergence of the serial block-Jacobi EVD algorithm for Hermitian matrices
    Gabriel Oksa; Yusaku Yamamoto; Marian Vajtersic
    NUMERISCHE MATHEMATIK, SPRINGER HEIDELBERG, 136巻, 4号, 掲載ページ 1071-1095, 出版日 2017年08月, 査読付, We provide the proof of the asymptotic quadratic convergence of the classical serial block-Jacobi EVD algorithm for Hermitian matrices with well-separated eigenvalues (including the multiple ones) as well as clusters of eigenvalues. At each iteration step, two off-diagonal blocks with the largest Frobenius norm are eliminated which is an extension of the original Jacobi approach to the block case. Numerical experiments illustrate and confirm the developed theory.
    研究論文(学術雑誌), 英語
  • On the optimality and sharpness of Laguerre’s lower bound on the smallest eigenvalue of a symmetric positive definite matrix
    Y. Yamamoto
    Applications of Mathematics, Springer, 62巻, 4号, 掲載ページ 319-331, 出版日 2017年08月, 査読付, Lower bounds on the smallest eigenvalue of a symmetric positive definite matrix A a R (mxm) play an important role in condition number estimation and in iterative methods for singular value computation. In particular, the bounds based on Tr(A (-1)) and Tr(A (-2)) have attracted attention recently, because they can be computed in O(m) operations when A is tridiagonal. In this paper, we focus on these bounds and investigate their properties in detail. First, we consider the problem of finding the optimal bound that can be computed solely from Tr(A (-1)) and Tr(A (-2)) and show that the so called Laguerre's lower bound is the optimal one in terms of sharpness. Next, we study the gap between the Laguerre bound and the smallest eigenvalue. We characterize the situation in which the gap becomes largest in terms of the eigenvalue distribution of A and show that the gap becomes smallest when {Tr(A (-1))}(2)/Tr(A (-2)) approaches 1 or m. These results will be useful, for example, in designing efficient shift strategies for singular value computation algorithms.
    研究論文(学術雑誌), 英語
  • Performance analysis and optimization of the parallel one-sided block Jacobi SVD algorithm with dynamic ordering and variable blocking
    Shuhei Kudo; Yusaku Yamamoto; Martin Becka; Marian Vajtersic
    CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE, WILEY, 29巻, 9号, 出版日 2017年05月, 査読付, The one-sided block Jacobi (OSBJ) method is known to be an efficient method for computing the singular value decomposition on a parallel computer. In this paper, we focus on the most recent variant of the OSBJ method, the one with parallel dynamic ordering and variable blocking, and present both theoretical and experimental analyses of the algorithm. In the first part of the paper, we provide a detailed theoretical analysis of its convergence properties. In the second part, based on preliminary performance measurement on the Fujitsu FX10 and SGI Altix ICE parallel computers, we identify two performance bottlenecks of the algorithm and propose new implementations to resolve the problem. Experimental results show that they are effective and can achieve up to 1.8 and 1.4 times speedup of the total execution time on the FX10 and the Altix ICE, respectively. Comparison with the ScaLAPACK SVD routine PDGESVD shows that our OSBJ solver is efficient when solving small to medium sized problems (n<10000) using modest number (<100) of computing nodes. Copyright (c) 2016 John Wiley & Sons, Ltd.
    研究論文(学術雑誌), 英語
  • 箱と玉の両方に番号が付いた箱玉系について
    福田 亜希子; 山本有作; 岩崎雅史; 石渡 恵美子; 中村佳正
    九州大学応用力学研究所 研究集会報告 「非線形波動研究の深化と展開」, 28AO-S6巻, 掲載ページ 87-92, 出版日 2017年03月, 査読付
    日本語
  • Probabilistic analysis of an estimator for the Frobenius norm of a matrix product
    Yusaku Yamamoto; Shuhei Kudo
    JSIAM Letters, 9巻, 掲載ページ 9-12, 出版日 2017年02月23日, 査読付
    研究論文(学術雑誌), 英語
  • Xeon PhiにおけるDSYRKの並列化手法と性能解析
    工藤 周平; 山本 有作
    情報処理学会論文誌コンピューティングシステム(ACS), 9巻, 4号, 掲載ページ 15-24, 出版日 2016年05月30日, 査読付
    研究論文(学術雑誌), 日本語
  • On constructing cost models for online automatic tuning using ATMathCoreLib: Case studies through the SVD computation on a multicore processor
    Seiji Nagashima; Takeshi Fukaya; Yusaku Yamamoto
    2016 IEEE 10TH INTERNATIONAL SYMPOSIUM ON EMBEDDED MULTICORE/MANY-CORE SYSTEMS-ON-CHIP (MCSOC), IEEE, 掲載ページ 345-352, 出版日 2016年, 査読付, We consider the problem of online automatic tuning. In this setting, we execute the target program with some tuning parameters N times, where N is given, while optimizing the parameters to minimize some objective function such as the total execution time. Thus we have to choose the parameters for each execution by taking into account the trade-off between exploration and exploitation. The ATMathCoreLib library developed by Suda is a set of software that solves this problem. To model the performance of the target software, ATMathCoreLib uses a linear statistical model, and its basis functions must be provided by the user.
    In this paper, we investigate how to choose the basis functions appropriately, using the singular value decomposition of a square matrix as an example. We consider three cases, namely, (I) when the performance characteristics of the target problem are well understood by the user, (II) when the tuning parameter has a complicated structure, as occurs in the case of simultaneous selection of an algorithm and its parameter, and (III) when the performance characteristics of the target problem are not known to the user. The results of using ATMathCoreLib with different basis functions for each case are given. They help one understand the tuning by ATMathCoreLib and contribute to the progress of ATMathCoreLib.
    研究論文(国際会議プロシーディングス), 英語
  • Roundoff error analysis of the CholeskyQR2 algorithm in an oblique inner product
    Y. Yamamoto; Y. Nakatsukasa; Y. Yanagisawa; T. Fukaya
    JSIAM Letters, 一般社団法人 日本応用数理学会, 8巻, 掲載ページ 5-8, 出版日 2016年, 査読付, The Cholesky QR algorithm is an ideal QR decomposition algorithm for high performance computing, but known to be unstable. We present error analysis of the Cholesky QR algorithm in an oblique inner product defined by a positive definite matrix, and show that by repeating the algorithm twice (called CholeskyQR2), its stability is greatly improved.
    研究論文(学術雑誌), 英語
  • Performance of the Parallel One-Sided Block Jacobi SVD Algorithm on a Modern Distributed-Memory Parallel Computer
    Shuhei Kudo; Yusaku Yamamoto; Martin Becka; Marian Vajtersic
    PARALLEL PROCESSING AND APPLIED MATHEMATICS, PPAM 2015, PT I, SPRINGER INT PUBLISHING AG, 9573巻, 掲載ページ 594-604, 出版日 2016年, 査読付, The one-sided block Jacobi (OSBJ) method is known to be an efficient algorithm for computing the singular value decomposition. In this paper, we evaluate the performance of the most recent variant of the OSBJ method, the one with dynamic ordering and variable blocking, on the Fujitsu FX10 parallel computer. By analyzing the performance results, we identified two bottlenecks, namely, weight computation for ordering and diagonalization of 2x2 block matrices. To resolve the problem, we propose new implementations for these two tasks. Experimental results show that they are effective and can achieve speedup of up to 1.6 times in total. As a result, our OSBJ solver can compute the SVD of matrices of order 2048 to 8192 on 12 to 48 nodes of FX10 more than three times faster than ScaLAPACK PDGESVD.
    研究論文(国際会議プロシーディングス), 英語
  • On constructing cost models for online automatic tuning using ATMathCoreLib
    Seiji Nagashima; Takeshi Fukaya; Yusaku Yamamoto
    Proceedings of IEEE MCSoC 2016, IEEE Computer Society Press, 1巻, 1号, 掲載ページ 1-8, 出版日 2016年, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • CONSERVED QUANTITIES OF THE INTEGRABLE DISCRETE HUNGRY SYSTEMS
    Sonomi Kakizaki; Akiko Fukuda; Yusaku Yamamoto; Masashi Iwasaki; Emiko Ishiwata; Yoshimasa Nakamura
    DISCRETE AND CONTINUOUS DYNAMICAL SYSTEMS-SERIES S, AMER INST MATHEMATICAL SCIENCES, 8巻, 5号, 掲載ページ 889-899, 出版日 2015年10月, 査読付, In this paper, conserved quantities of the discrete hungry Lotka-Volterra (dhLV) system are derived. Our approach is based on the Lax representation of the dhLV system, which expresses the time evolution of the dhLV system as a similarity transformation on a certain square matrix. Thus, coefficients of the characteristic polynomial of this matrix constitute conserved quantities of the dhLV system. These coefficients are calculated explicitly through a recurrence relation among the characteristic polynomials of its leading principal submatrices. The conserved quantities of the discrete hungry Toda (dhToda) equation is also derived with the help of the Backlund transformation between the dhLV system and the dhToda equation.
    研究論文(学術雑誌), 英語
  • A new subtraction-free formula for lower bounds of the minimal singular value of an upper bidiagonal matrix
    Takumi Yamashita; Kinji Kimura; Yusaku Yamamoto
    NUMERICAL ALGORITHMS, SPRINGER, 69巻, 4号, 掲載ページ 893-912, 出版日 2015年08月, 査読付, Traces of inverse powers of a positive definite symmetric tridiagonal matrix give lower bounds of the minimal singular value of an upper bidiagonal matrix. In a preceding work, a formula for the traces which gives the diagonal entries of the inverse powers is presented. In this paper, we present another formula which gives the traces based on a quite different idea from the one in the preceding work. An efficient implementation of the formula for practice is also presented.
    研究論文(学術雑誌), 英語
  • 離散戸田方程式のある拡張に基づくTotally Nonnegative行列の固有値計算アルゴリズム
    隅蔵亮; 福田亜希子; 石渡恵美子; 山本有作; 岩崎雅史; 中村佳正
    九州大学応用力学研究所 研究集会報告 「非線形波動研究の現状-課題と展望を探る-」, 26AO-S2巻, 掲載ページ 115-120, 出版日 2015年03月, 査読付
    日本語
  • 離散ハングリー戸田型方程式による上ヘッセンベルグTN行列の固有値計算(仮訳)
    隅蔵・福田; 石渡; 山本; 岩崎・中村
    AIP Conference Proceedings 1648, 1648巻, 出版日 2015年, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • An asymptotic analysis for an integrable variant of the Lotka–Volterra prey–predator model via a determinant expansion technique
    M. Shinjo; M. Iwasaki; A. Fukuda; E. Ishiwata; Y. Yamamoto; Y. Nakamura
    Cogent Mathematics, TAYLOR & FRANCIS AS, 2巻, 1号, 掲載ページ 1-14, 出版日 2015年, 査読付, The Hankel determinant appears in representations of solutions to several integrable systems. An asymptotic expansion of the Hankel determinant thus plays a key role in the investigation of asymptotic analysis of such integrable systems. This paper presents an asymptotic expansion formula of a certain Casorati determinant as an extension of the Hankel case. This Casorati determinant is then shown to be associated with the solution to the discrete hungry Lotka-Volterra (dhLV) system, which is an integrable variant of the famous prey-predator model in mathematical biology. Finally, the asymptotic behavior of the dhLV system is clarified using the expansion formula for the Casorati determinant.
    研究論文(学術雑誌), 英語
  • ROUNDOFF ERROR ANALYSIS OF THE CHOLESKYQR2 ALGORITHM
    Yusaku Yamamoto; Yuji Nakatsukasa; Yuka Yanagisawa; Takeshi Fukaya
    ELECTRONIC TRANSACTIONS ON NUMERICAL ANALYSIS, KENT STATE UNIVERSITY, 44巻, 掲載ページ 306-326, 出版日 2015年, 査読付, We consider the QR decomposition of an m x n matrix X with full column rank, where m >= n. Among the many algorithms available, the Cholesky QR algorithm is ideal from the viewpoint of high performance computing since it consists entirely of standard level 3 BLAS operations with large matrix sizes, and requires only one reduce and broadcast in parallel environments. Unfortunately, it is well-known that the algorithm is not numerically stable and the deviation from orthogonality of the computed Q factor is of order O((kappa(2)(X))(2) u), where kappa(2)(X) is the 2-norm condition number of X and u is the unit roundoff. In this paper, we show that if the condition number of X is not too large, we can greatly improve the stability by iterating the Cholesky QR algorithm twice. More specifically, if kappa(2)(X) is at most O(u(-1/2)), both the residual and deviation from orthogonality are shown to be of order 0(u). Numerical results support our theoretical analysis.
    研究論文(学術雑誌), 英語
  • Implementation details of an extended oqds algorithm for singular values
    S. Araki; K. Kimura; Y. Yamamoto; Y. Nakamura
    JSIAM Letters, The Japan Society for Industrial and Applied Mathematics, 7巻, 掲載ページ 9-12, 出版日 2015年, 査読付, We introduce an extended oqds algorithm for singular values of lower tridiagonal matrix which is a condensed form of inputted full matrix. Reduction to the lower tridiagonal matrix is able to be performed using cache-efficient block Householder method based on BLAS 2.5 routines. In this letter, we describe the implementation details of the latter algorithm such as the shift strategy and criteria for deflation and splitting. The effectiveness of our approach is demonstrated by numerical experiments.
    研究論文(学術雑誌), 英語
  • 通信削減アルゴリズムCAQRのRSDFTの直交化処理への適用と評価
    片桐孝洋; 高山恒一; 米村崇; 熊洞宏樹; 猪貝光祥; 北上純一; 江口義之; 深谷猛; 山本有作; 岩田潤一; 内田和之; 大島聡史; 中島研吾
    情報処理学会研究報告(Web), 一般社団法人情報処理学会, 2014巻, HPC-144号, 掲載ページ VOL.2014-HPC-144,NO.3 (WEB ONLY)-6, 出版日 2014年05月19日, 本報告では,量子力学的第一原理シミュレーションのソフトウェア RSDFT における直交化処理に,通信削減アルゴリズムを用いた QR 分解アルゴリズムである CAQR を組み込んだ性能について報告する.東京大学情報基盤センターの FX10 を用いた 1,024 ノード実行 (4,096MPI,MPI 当たり 4OMP 実行のハイブリッド MPI-OpenMP 実行) におけるバンド分割が 64 の時の実行では,従来の Gram-Schmidt 法による直交化に比べ CAQR を利用すると,最大で 11 倍の高速化が得られる事例があった.
    日本語
  • 箱に番号が付いた新しい箱玉系について
    柿崎苑美; 福田亜希子; 石渡恵美子; 山本有作; 岩崎雅史; 中村佳正
    九州大学応用力学研究所 研究集会報告 「非線形波動研究の拡がり」, 25AO-S2巻, 掲載ページ 121-126, 出版日 2014年03月, 査読付
    日本語
  • Performance Analysis of the Householder-Type Parallel Tall-Skinny QR Factorizations Toward Automatic Algorithm Selection.
    Takeshi Fukaya; Toshiyuki Imamura; Yusaku Yamamoto
    High Performance Computing for Computational Science - VECPAR 2014 - 11th International Conference, Eugene, OR, USA, June 30 - July 3, 2014, Revised Selected Papers, Springer, 掲載ページ 269-283, 出版日 2014年, 査読付
  • Convergence analysis of the parallel classical block Jacobi method for the symmetric eigenvalue problem
    Y. Yamamoto; L. Zhang; S. Kudo
    JSIAM Letters, 6巻, 掲載ページ 57-60, 出版日 2014年, 査読付
    研究論文(学術雑誌), 英語
  • Performance analysis of the Householder-type parallel tall-skinny QR factorizations toward automatic algorithm selection
    T. Fukaya; T. Imamura; Y. Yamamoto
    Proceedings of VECPAR 2014, 1巻, 1号, 掲載ページ 1-1, 出版日 2014年, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • CholeskyQR2: A Simple and Communication-Avoiding Algorithm for Computing a Tall-Skinny QR Factorization on a Large-Scale Parallel System
    Takeshi Fukaya; Yuji Nakatsukasa; Yuka Yanagisawa; Yusaku Yamamoto
    2014 5th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA), IEEE, 1巻, 1号, 掲載ページ 31-38, 出版日 2014年, 査読付, Designing communication-avoiding algorithms crucial for high performance computing on a large-scale parallel system. The TSQR algorithm is a communication-avoiding algorithm for computing a tall-skinny QR factorization, and TSQR is known to he much faster and as stable as the classical Householder QR algorithm The Cholesky QR algorithm is another very simple and fast communication-avoiding algorithm, but rarely used in practice because of its numerical instability. Our recent work points out that an algorithm that simply repeats Cholesky QR twice, which we call CholeskyQR2, gives excellent accuracy for a wide range of matrices arising in practice. Although the communication cost of CholeskyQR2 is twice that of TSQR, it has an advantage that its reduction operation is addition whereas that of TSQR is a QR factorization, whose high-performance implementation is more difficult. Thus, CholeskvQR2 can potentially be significantly faster than TSQR. Indeed, in our experiments using 16384 nodes of the K computer, CholeskyQR2 ran about three times faster than TSQR for a 4194304 x 64 matrix,
    研究論文(国際会議プロシーディングス), 英語
  • Integrable discrete hungry systems and their related matrix eigenvalues
    Akiko Fukuda; Emiko Ishiwata; Yusaku Yamamoto; Masashi Iwasaki; Yoshimasa Nakamura
    ANNALI DI MATEMATICA PURA ED APPLICATA, SPRINGER HEIDELBERG, 192巻, 3号, 掲載ページ 423-445, 出版日 2013年06月, 査読付, Recently, some of the authors designed an algorithm, named the dhLV algorithm, for computing complex eigenvalues of a certain class of band matrix. The recursion formula of the dhLV algorithm is based on the discrete hungry Lotka-Volterra (dhLV) system, which is an integrable system. One of the authors has proposed an algorithm, named the multiple dqd algorithm, for computing eigenvalues of a totally nonnegative (TN) band matrix. In this paper, by introducing a theorem on matrix eigenvalues, we first show that the eigenvalues of a TN matrix are also computable by the dhLV algorithm. We next clarify the asymptotic behavior of the discrete hungry Toda (dhToda) equation, which is also an integrable system, and show that a similarity transformation for a TN matrix is given through the dhToda equation. Then, by combining these properties of the dhToda equation, we design a new algorithm, named the dhToda algorithm, for computing eigenvalues of a TN matrix. We also describe the close relationship among the above three algorithms and give numerical examples.
    研究論文(学術雑誌), 英語
  • ハングリー型の離散可積分系と非対称行列の固有値計算 : 可積分アルゴリズムにおける最近の発展(サーベイ,<特集>応用可積分系研究部会)
    福田 亜希子; 岩崎 雅史; 山本 有作; 石渡 恵美子; 中村 佳正
    日本応用数理学会論文誌, 一般社団法人 日本応用数理学会, 23巻, 1号, 掲載ページ 109-181, 出版日 2013年, 査読付, 近年,ハングリー型の離散可積分系である離散ハングリー戸田方程式と離散ハングリーロトカ・ボルテラ系から,非対称行列の固有値が高精度に求まるアルゴリズムが定式化されている.本論文では,アルゴリズムの導出過程に加え,中心多様体理論を利用した漸近解析,浮動小数点数演算における混合誤差解析,高速化のための原点シフトに関する結果について概説する.ハングリー型の離散可積分系を結ぶベックルント変換についても示す.
    研究論文(学術雑誌), 日本語
  • On a shifted LR transformation derived from the discrete hungry Toda equation
    Akiko Fukuda; Yusaku Yamamoto; Masashi Iwasaki; Emiko Ishiwata; Yoshimasa Nakamura
    Monatshefte fur Mathematik, 170巻, 1号, 掲載ページ 11-26, 出版日 2013年, 査読付, The discrete hungry Toda (dhToda) equation is known as an integrable system which is derived from the study of the numbered box and ball system. In the authors' paper (Fukuda et al., in Phys Lett A 375, 303-308, 2010), we associate the dhToda equation with a sequence of LR transformations for a totally nonnegative (TN) matrix, and then, in another paper (Fukuda et al. in Annal Math Pura Appl, 2011), based on the dhToda equation, we design an algorithm for computing the eigenvalues of the TN matrix. In this paper, in order to accelerate the convergence speed, we first introduce the shift of origin into the LR transformations associated with the dhToda equation, then derive a recursion formula for generating the shifted LR transformations. We next present a shift strategy for avoiding the breakdown of the shifted LR transformations. We finally clarify the asymptotic convergence and show that the sequence of TN matrices generated by the shifted LR transformations converges to a lower triangular matrix, exposing the eigenvalues of the original TN matrix. The asymptotic convergence is also verified through some numerical examples. © 2012 Springer-Verlag.
    研究論文(学術雑誌), 英語
  • 動的計画法を用いたブロックハウスホルダQR分解アルゴリズムの性能最適化 (コンピューティングシステム Vol.4 No.4)
    深谷 猛; 山本 有作; 張 紹良
    情報処理学会論文誌 論文誌トランザクション, 情報処理学会, 2011巻, 2号, 掲載ページ 146-157, 出版日 2012年04月, 査読付
    日本語
  • シフト付きLR変換に付随する離散ハングリー系について
    濱洋輔; 福田亜希子; 山本有作; 岩崎雅史; 石渡恵美子; 中村佳正
    九州大学応用力学研究所 研究集会報告 「非線形波動研究の進展 -現象と数理の相互作用-」, 23AO-S7巻, 掲載ページ 159-164, 出版日 2012年03月, 査読付
    日本語
  • Error analysis for matrix eigenvalue algorithm based on the discrete hungry Toda equation
    A. Fukuda; Y. Yamamoto; M. Iwasaki; E. Ishiwata; Y. Nakamura
    Numerical Algorithms, 61巻, 2号, 掲載ページ 243-260, 出版日 2012年, 査読付
    英語
  • On some properties of a discrete hungry Lotka-Volterra system of multiplicative type
    Yosuke Hama; Akiko Fukuda; Yusaku Yamamoto; Masashi Iwasaki; Emiko Ishiwata; Yoshimasa Nakamura
    Journal of Math-for-Industry, 4巻, 掲載ページ 5-15, 出版日 2012年, 査読付
    英語
  • Optimization of the Multishift QR Algorithm with Coprocessors for Non-Hermitian Eigenvalue Problems
    Takafumi Miyata; Yusaku Yamamoto; Takashi Uneyama; Yoshimasa Nakamura; Shao-Liang Zhang
    EAST ASIAN JOURNAL ON APPLIED MATHEMATICS, GLOBAL SCIENCE PRESS, 1巻, 2号, 掲載ページ 187-196, 出版日 2011年05月, 査読付, The multishift QR algorithm is efficient for computing all the eigenvalues of a dense, large-scale, non-Hermitian matrix. The major part of this algorithm can be performed by matrix-matrix multiplications and is therefore suitable for modern processors with hierarchical memory. A variant of this algorithm was recently proposed which can execute more computational parts by matrix-matrix multiplications. The algorithm is especially appropriate for recent coprocessors which contain many processor-elements such as the CSX600. However, the performance of the algorithm highly depends on the setting of parameters such as the numbers of shifts and divisions in the algorithm. Optimal settings are different depending on the matrix size and computational environments. In this paper, we construct a performance model to predict a setting of parameters which minimizes the execution time of the algorithm. Experimental results with the CSX600 coprocessor show that our model can be used to find the optimal setting.
    研究論文(学術雑誌), 英語
  • A block IDR(s) method for nonsymmetric linear systems with multiple right-hand sides
    L. Du; T. Sogabe; B. Yu; Y. Yamamoto; S. -L. Zhang
    JOURNAL OF COMPUTATIONAL AND APPLIED MATHEMATICS, ELSEVIER SCIENCE BV, 235巻, 14号, 掲載ページ 4095-4106, 出版日 2011年05月, The IDR(s) based on the induced dimension reduction (IDR) theorem, is a new class of efficient algorithms for large nonsymmetric linear systems. IDR(1) is mathematically equivalent to BiCGStab at the even IDR(1) residuals, and IDR(s) with s > 1 is competitive with most Bi-CG based methods. For these reasons, we extend the IDR(s) to solve large nonsymmetric linear systems with multiple right-hand sides. In this paper, a variant of the IDR theorem is given at first, then the block IDR(s), an extension of IDR(s) based on the variant IDR(s) theorem, is proposed. By analysis, the upper bound on the number of matrix-vector products of block IDR(s) is the same as that of the IDR(s) for a single right-hand side in generic case, i.e., the total number of matrix-vector products of IDR(s) may be m times that of of block IDR(s), where in is the number of right-hand sides. Numerical experiments are presented to show the effectiveness of our proposed method. (C) 2011 Elsevier B.V. All rights reserved.
    研究論文(学術雑誌), 英語
  • A Bäcklund transformation between two integrable discrete hungry systems
    A. Fukuda; Y. Yamamoto; M. Iwasaki; E. Ishiwata; Y. Nakamura
    Physics Letters, Section A: General, Atomic and Solid State Physics, 375巻, 3号, 掲載ページ 303-308, 出版日 2011年01月17日, 査読付
    英語
  • Acceleration of Hessenberg Reduction for Nonsymmetric Eigenvalue Problems in a Hybrid CPU-GPU Computing Environment.
    Jun-ichi Muramatsu; Takeshi Fukaya; Shao-Liang Zhang; Kinji Kimura; Yusaku Yamamoto
    IJNC, 1巻, 2号, 掲載ページ 132-143, 出版日 2011年, 査読付
  • Four-point correlation function of a passive scalar field in rapidly fluctuating turbulence: Numerical analysis of an exact closure equation
    Y. Mizuno; K. Ohi; T. Sogabe; Y. Yamamoto; Y. Kaneda
    Physical Review E - Statistical, Nonlinear, and Soft Matter Physics, 82巻, 出版日 2010年09月20日, A numerical analysis is made on the four-point correlation function in a similarity range of a model of two-dimensional passive scalar field ψ advected by a turbulent velocity field with infinitely small correlation time. The model yields an exact closure equation for the four-point correlation Ψ4 of ψ, which may be casted into the form of an eigenvalue problem in the similarity range. The analysis of the eigenvalue problem gives not only the scale dependence of Ψ4, but also the dependence on the configuration of the four points. The numerical analysis gives S4 (R) R ζ4 in the similarity range in which S2 (R) R ζ2, where SN is the structure function defined by SN (R) [ψ (x+R) -ψ x)] N and ζ4 ≠ 2 ζ2. The estimate of ζ4 by the numerical analysis of the eigenvalue problem is in good agreement with numerical simulations so far reported. The agreement supports the idea of universality of the exponent ζ4 in the sense that ζ4 is insensitive to conditions of ψ outside the similarity range. The numerical analysis also shows that the correlation C (R,r) [ψ (x+R)-ψ (x)] 2 [ψ (x+r) -ψ (x) ] 2 is stronger than that given by the joint-normal approximation, and scales like C (R,r) (r/R) χ for r/R1 with R and r in the similarity range, where χ is a constant depending on the angle between R and r. © 2010 The American Physical Society.
  • 密正方行列特異値分解における並列I-SVD法の特性を用いた後処理の高速化
    豊川博己; 山本有作; 木村欣司; 高田雅美; 中村佳正
    情報処理学会論文誌. コンピューティングシステム, 3巻, 2号, 掲載ページ 30-38, 出版日 2010年06月, 査読付
    研究論文(学術雑誌), 日本語
  • Acceleration of Hessenberg reduction for nonsymmetric eigenvalue problems using GPU
    Jun-Ichi Muramatsu; Shao-Liang Zhang; Yusaku Yamamoto
    Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 掲載ページ 215-219, 出版日 2010年, Solution of large-scale dense nonsymmetric eigen-value problem is required in many areas of scientific and engineering computing, such as vibration analysis of automobiles and analysis of electronic diffraction patterns. In this study, we focus on the Hessenberg reduction step and consider accelerating it using GPU. Our main strategy is to use the CUBLAS, an optimized BLAS library for GPU. However, since Hessenberg reduction requires operations not supported by CUBLAS, we combine CPU and GPU to perform the computation. We propose two approaches for combining CPU and GPU: the one that performs as much work as possible on GPU and the one that aggressively assigns computation of small-size matrices to CPU. Experimental results show that the latter approach is considerably faster than the former. Compared with the computation on the Core i7 processor with 4 cores, the latter approach with the Tesla C1060 GPU and the Core 17 processor achieves 2.8 times speedup when computing the Hessenberg form of a 4,800 x 4,800 real matrix. © 2010 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • Dynamic programming approaches to optimizing the blocking strategy for basic matrix decompositions
    Yusaku Yamamoto; Takeshi Fukaya
    Software Automatic Tuning: From Concepts to State-of-the-Art Results, Springer New York, 掲載ページ 69-85, 出版日 2010年, 査読付, In this chapter, we survey several approaches to optimizing the blocking strategy for basic matrix decompositions, such as LU, Cholesky, and QR. Conventional blocking strategies such as fixed-size blocking and recursive blocking are widely used to optimize the performance of these decompositions. However, these strategies have only a small number of parameters such as the block size or the level of recursion and are not sufficiently flexible to exploit the performance of modern high-performance architectures. As such, several attempts have been made to define a much larger class of strategies and to choose the best strategy among them according to the target machine and the matrix size. The number of candidate strategies is usually exponential in the size of the matrix. However, with the use of dynamic programming, the cost of optimization can be reduced to a realistic level. As representatives of such approaches, we survey variable-size blocking, generalized recursive blocking, and the combination of variable-size blocking and the TSQR algorithm. Directions for future research are also discussed. © 2010 Springer Science+Business Media LLC.
    論文集(書籍)内論文, 英語
  • Differential qd algorithm for totally nonnegative Hessenberg matrices: introduction of origin shifts and relationship with the discrete hungry Lotka-Volterra system
    YAMAMOTO Yusaku; FUKAYA Takeshi
    JSIAM Lett (Web), 2巻, 掲載ページ 69-72 (J-STAGE), 出版日 2010年, 査読付
    英語
  • 多重連結領域の固有値問題に対するSakurai‐Sugiura法の拡張
    宮田考史; DU Lei; 曽我部知広; 山本有作; ZHANG Shao‐Liang
    日本応用数理学会論文誌, 19巻, 4号, 掲載ページ 537-550, 出版日 2009年12月25日
    日本語
  • 正方行列向け特異値分解のCUDAによる高速化
    深谷猛; 山本有作; 畝山多加志; 中村佳正
    情報処理学会論文誌トランザクション(CD-ROM), 2009巻, 1号, 掲載ページ KONPYUTINGUSHISUTEMU,VOL.2,NO.2,98-109, 出版日 2009年11月, 査読付
    日本語
  • 正方行列向け特異値分解のCUDAによる高速化
    深谷猛; 山本有作; 畝山多加志; 中村佳正
    情報処理学会論文誌. コンピューティングシステム, 2巻, 2号, 掲載ページ 98-109, 出版日 2009年07月, 査読付
    研究論文(学術雑誌), 日本語
  • An efficient bidiagonalization algorithm for combined CPU-accelerator environments
    Yusaku Yamamoto; Takeshi Fukaya; Takashi Uneyama; Yoshimasa Nakamura
    Proceedings of the IASTED International Conference on Parallel and Distributed Computing and Networks, PDCN 2009, 掲載ページ 121-126, 出版日 2009年, In computing the singular values of a square matrix, transformation of the input matrix to bidiagonal form accounts for most of the computation time. In this paper, we consider speeding up this process using a combination of CPU and floating-point accelerator. As an algorithm for bidiagonalization, we can use the conventional Householder's method or Bischof's two-phase algorithm, which can use the level-3 BLAS efficiently. We can also choose to store the whole matrix in the CPU memory or in the on-board memory of the accelerator. So there are four possible strategies. We investigate the advantages and disadvantages of each strategy and construct an analytical performance model for each of them. Using the models, we predict the performance of bidiagonalzation on the CSX600 accelerator and show that it is the best to achieve high performance to use Bischof's algorithm with the matrix stored in the on-board memory. This conclusion should hold for many other accelerators with similar performance characteristics.
    研究論文(国際会議プロシーディングス), 英語
  • Differential qd algorithm for totally nonnegative band matrices: convergence properties and error analysis
    YAMAMOTO Yusaku; FUKAYA Takeshi
    JSIAM Lett (Web), 1巻, 掲載ページ 56-59 (J-STAGE), 出版日 2009年, 査読付
    英語
  • 対称三重対角行列向けマルチシフトQR法の漸近的収束性解析
    宮田 考史; 岩崎 雅史; 山本 有作; 張 紹良
    日本応用数理学会論文誌, 18巻, 4号, 掲載ページ 563-577, 出版日 2008年12月, 査読付
    研究論文(学術雑誌), 日本語
  • A dynamic programming approach to optimizing the blocking strategy for the Householder QR decomposition.
    Takeshi Fukaya; Yusaku Yamamoto; Shao-Liang Zhang
    Proceedings of the 2008 IEEE International Conference on Cluster Computing, 29 September - 1 October 2008, Tsukuba, Japan, IEEE Computer Society, 掲載ページ 402-410, 出版日 2008年, 査読付
  • 長方行列向け特異値分解の浮動小数点コプロセッサによる高速化
    深谷猛; 山本有作; 畝山多加志; 堀玄, 梅野健
    情報処理学会論文誌, 48巻, SIG8(ACS18)号, 掲載ページ 31-43, 出版日 2007年05月, 査読付
    日本語
  • Accelerating the complex Hessenberg QR algorithm with the csx600 floating-point coprocessor
    Yusaku Yamamoto; Takafumi Miyata; Yoshimasa Nakamura
    Proceedings of the IASTED International Conference on Parallel and Distributed Computing and Systems, 掲載ページ 204-211, 出版日 2007年, In this paper, we show how to speed up the Hessenberg QR algorithm for computing the eigenvalues of a dense complex nonsymmetric matrix using the CSX600 floating-point coprocessor. Our approach is based on the small-bulge multishift QR algorithm proposed by Braman et al. This algorithm can perform a major part of the computation in the form of matrix multiplication and is therefore very suited to high performance architectures. However, to exploit the potential of the CSX600, the number of shifts must be increased to more than two hundred. In that case, the parts other than matrix multiplication begin to occupy a considerable percentage of the execution time, thereby limiting the speedup. To solve this problem, we focus on two most time-consuming parts in the algorithm except for matrix multiplication: accumulation of bulge-chasing transformations and solution of a decoupled small eigenproblem. We reconstruct the former as a recursive algorithm and apply a blocking technique to the latter. This enables these parts to be computed also using matrix multiplication. As a result of these optimizations, we obtained up to 3.8 times speedup with the CSX600 processor over a 3.2GHz Xeon processor when computing the eigenvalues of a 12,000 × 12,000 complex Hessenberg matrix.
    研究論文(国際会議プロシーディングス), 英語

MISC

  • 運搬車容量付きの箱に番号が付いた箱玉系とシフト付きLR変換との対応
    西脇友哉; 福田亜希子; 山本有作; 岩崎雅史
    出版日 2022年, 日本応用数理学会年会講演予稿集(CD-ROM), 2022巻, 1345-3378, 202302270405635318
  • 巨大行列の固有値計算
    山本有作
    日本評論社, 出版日 2020年02月01日, 数学セミナー, 59巻, 2号, 掲載ページ 12-17, 日本語, 査読付, 招待, 記事・総説・解説・論説等(商業誌、新聞、ウェブメディア)
  • A parallelizable energy-preserving integrator MB4 and its application to quantum-mechanical wavepacket dynamics
    Tsubasa Sakai; Shuhei Kudo; Hiroto Imachi; Yuto Miyatake; Takeo Hoshi; Yusaku Yamamoto
    submitted, 出版日 2020年, Preprint: https://arxiv.org/abs/2003.04345/
  • 緩和型スーパーノードマルチフロンタル法の最適な緩和パラメータについて
    中野 智輝; 横川 三津夫; 深谷 猛; 山本 有作
    数値シミュレーションにおける多くの問題は,偏微分方程式を離散化して得られる連立一次方程式を解く問題に帰着される.そして,多くの場合,連立一次方程式を解く時間は全体のシミュレーション時間の大部分を占める.よって,連立一次方程式を高速に解くことは非常に重要である.本研究では,正定値対称行列に適用できるコレスキー分解を扱う.疎行列に対して,コレスキー分解を行う手法はいくつかあるが,本稿では,緩和型スーパーノードマルチフロンタル法を用いた.同手法では,2 つのスーパーノードを融合する際に非零と見なす零要素数の上限である緩和パラメータが性能に大きな影響を与える。そこで,このパラメータの最適値を求めることを目的として,Intel Xeon (Ivy Bridge-EX) とIntel Xeon Phi(Knights Landing, KNL) のそれぞれ1 コ, 情報処理学会, 出版日 2018年12月, 情報処理学会第167回ハイパフォーマンスコンピューティング研究会, 2018-HPC-167巻, 28号, 掲載ページ 1-8, 日本語
  • 1次元分散型のCAQRアルゴリズムの性能評価とパネルサイズの自動チューニングに向けた検討
    深谷猛; 深谷猛; 深谷猛; 山本有作; 山本有作; 今村俊幸; 今村俊幸
    出版日 2015年06月08日, 計算工学講演会論文集(CD-ROM), 20巻, 掲載ページ ROMBUNNO.E-1-3, 日本語, 1342-145X, 201502216577000797
  • シフト付きコレスキーQR分解アルゴリズムの提案
    柳澤優香; 深谷猛; 中務佑治; RAMASESHAN Kannan; 山本有作; 大石進一
    出版日 2014年08月27日, 日本応用数理学会年会講演予稿集(CD-ROM), 2014巻, 掲載ページ ROMBUNNO.9GATSU4NICHI,09:30,F,2, 日本語, 1345-3378, 201402216291168986
  • 大規模並列計算機上での再直交化付きコレスキーQR分解の性能評価
    深谷猛; 中務佑治; 柳澤優香; 山本有作
    出版日 2014年08月27日, 日本応用数理学会年会講演予稿集(CD-ROM), 2014巻, 掲載ページ ROMBUNNO.9GATSU3NICHI,11:00,E,1, 日本語, 1345-3378, 201402294746261271
  • 固有値計算のためのハングリー型可積分アルゴリズムについて
    福田亜希子; 山本有作; 岩崎雅史; 石渡恵美子; 中村佳正
    出版日 2014年08月27日, 日本応用数理学会年会講演予稿集(CD-ROM), 2014巻, 掲載ページ ROMBUNNO.9GATSU4NICHI,09:30,C,2, 日本語, 1345-3378, 201402264849885641
  • 箱に番号が付いた新しい箱玉系について
    柿崎苑美; 福田亜希子; 石渡恵美子; 山本有作; 岩崎雅史; 中村佳正
    出版日 2014年, 九州大学応用力学研究所研究集会報告, 25AO-S2号, 掲載ページ 65-75, 日本語, 査読付, 研究発表ペーパー・要旨(全国大会,その他学術会議)
  • 超並列環境における密行列計算プログラムの性能モデリングに向けた検討
    深谷猛; 今村俊幸; 山本有作
    出版日 2013年07月24日, 情報処理学会研究報告(Web), 2013巻, HPC-140号, 掲載ページ WEB ONLY VOL.2013-HPC-140,NO.41, 日本語, 201502261843444684
  • 超並列環境における縦長行列のQR分解に対する自動チューニングの検討
    深谷猛; 山本有作
    出版日 2013年06月19日, 計算工学講演会論文集(CD-ROM), 18巻, 掲載ページ ROMBUNNO.D-13-4, 日本語, 1342-145X, 201302237393474291
  • 京における密行列固有値ソルバEigen-Kの性能評価と性能モデリング
    深谷猛; 今村俊幸; 山本有作
    出版日 2013年05月15日, 先進的計算基盤システムシンポジウム論文集, 2013巻, 掲載ページ 132-133, 日本語, 170000076930
  • オンライン自動チューニング数理基盤ライブラリATMathCoreLibの特異値分解問題への適用
    長島聖児; 深谷猛; 山本有作
    出版日 2013年, 日本応用数理学会年会講演予稿集(CD-ROM), 2013巻, 掲載ページ ROMBUNNO.9076, 日本語, 1345-3378, 201402207997990957
  • ブロックヤコビ法に基づく固有値解法の超並列計算機上での実装
    工藤周平; 高橋佑輔; 深谷猛; 山本有作
    出版日 2013年, 日本応用数理学会年会講演予稿集(CD-ROM), 2013巻, 掲載ページ ROMBUNNO.9142, 日本語, 1345-3378, 201402271508181510
  • 京コンピュータにおける対称密行列向け固有値計算プログラムの性能評価と性能予測
    深谷猛; 今村俊幸; 山本有作
    出版日 2013年, 日本応用数理学会年会講演予稿集(CD-ROM), 2013巻, 掲載ページ ROMBUNNO.9104, 日本語, 1345-3378, 201402299178620107
  • ハウスホルダー変換に基づく直交化法の最近の進展 : 並列計算・高性能計算の観点から (科学技術計算における理論と応用の新展開)
    山本 有作
    京都大学, 出版日 2012年04月, 数理解析研究所講究録, 1791巻, 掲載ページ 57-65, 日本語, 1880-2818, 110009435842, AN00061013
  • 離散ハングリー戸田方程式に基づく Totally Nonnegative 行列に対する固有値計算
    福田亜希子; 山本有作; 岩崎雅史; 石渡恵美子; 中村佳正
    出版日 2012年04月, 京都大学数理解析研究所講究録 「科学技術計算における理論と応用の新展開」, 1791巻, 掲載ページ 1-10, 日本語
  • SMP上での並列QR分解に対する自動チューニングの検討
    深谷猛; 山本有作; 張紹良
    出版日 2012年, 日本応用数理学会年会講演予稿集(CD-ROM), 2012巻, 掲載ページ 283-284, 日本語, 1345-3378, 201302298604265740
  • 動的計画法を用いたブロックハウスホルダQR分解アルゴリズムの性能最適化
    深谷 猛; 山本 有作; 張 紹良
    密行列計算においては,高性能化のためにアルゴリズムのブロック化が必須である.その際に,ブロック化の方法次第で性能が大きく変化するため,その最適化が重要な課題となっている.しかしながら,ブロック化の自由度が大きいため,従来は限定された範囲内で最適化を行うことがほとんどである.本論文では,QR 分解アルゴリズムを対象として,二分木を使うことで従来より格段に広いクラスのブロック化の方法を系統的に扱い,その中から動的計画法により最適なブロック化の方法を決定する手法を提案する.数値実験の結果,提案手法がブロック分割法に対する自動チューニング手法として有望であることが示された.Blocking techniques are widely used in high performance matrix computations. When using them, it is important to optimize a blocking way, which influences the performance of computations. However, because of the high degree of freedom in blocking techniques, such optimization is generally done in a limited class of blocking ways. In this paper, we propose a framework to determine the efficient blocking way for the algorithm of QR decomposition. In our framework, various kinds of blocking ways are represented systematically with binary trees and an optimal one is determined by dynamic programming. Results of numerical experiments show that our framework has good possibilities in the view of the automatic performance tuning., 情報処理学会, 出版日 2011年10月05日, 情報処理学会論文誌コンピューティングシステム(ACS), 4巻, 4号, 掲載ページ 146-157, 日本語, 1882-7829, 40019259189, AA11833852
  • QR分解アルゴリズムに対する自動チューニング―性能モデルに関する考察―
    深谷猛; 山本有作; ZHANG Shao‐Liang
    出版日 2011年08月15日, 情報処理学会研究報告(CD-ROM), 2011巻, 2号, 掲載ページ ROMBUNNO.HPC-130,NO.42, 日本語, 2186-2583, 201102215660199701
  • LR flow から導かれる離散ハングリー系のベックルント変換
    福田亜希子; 濱洋輔; 山本有作; 岩崎雅史; 石渡恵美子; 中村佳正
    出版日 2011年03月, 九州大学応用力学研究所 研究集会報告 「非線形波動研究の新たな展開 ― 現象とモデル化-」, 22AO-S8巻, 掲載ページ 182-187, 日本語
  • 動的計画法に基づく密行列計算アルゴリズムの再帰的ブロック化
    深谷猛; 山本有作; 張紹良
    出版日 2011年01月11日, ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集, 2011巻, 掲載ページ 65-65, 日本語, 170000063932
  • シフトを考慮したLR変換に関連する離散ハングリー系について
    濱洋輔; 福田亜希子; 石渡恵美子; 岩崎雅史; 山本有作; 中村佳正
    出版日 2011年, 日本応用数理学会年会講演予稿集, 2011巻, 掲載ページ 69-70, 日本語, 1345-3378, 201102251195821308
  • 密行列計算アルゴリズムに対するブロック分割法の最適化と性能評価
    深谷猛; 山本有作; ZHANG Shao‐Liang
    出版日 2010年10月15日, 情報処理学会研究報告(CD-ROM), 2010巻, 3号, 掲載ページ ROMBUNNO.HPC-126,NO.33, 日本語, 2186-2583, 201002258680016739
  • 数値計算のための自動チューニング 階層的な性能モデルに基づく行列計算の自動チューニング
    山本有作; 深谷猛
    出版日 2010年09月24日, 応用数理, 20巻, 3号, 掲載ページ 201-211, 日本語, 0917-2270, 201002247930381444
  • LR変換に関連する離散ハングリー系とそのベックルント変換 2
    濱洋輔; 福田亜希子; 石渡恵美子; 岩崎雅史; 山本有作; 中村佳正
    出版日 2010年09月, 日本応用数理学会年会講演予稿集, 2010巻, 掲載ページ 167-168, 日本語, 1345-3378, 201002234075524653
  • LR変換に関連する離散ハングリー系とそのベックルント変換 1
    福田亜希子; 山本有作; 岩崎雅史; 石渡恵美子; 中村佳正
    出版日 2010年09月, 日本応用数理学会年会講演予稿集, 2010巻, 掲載ページ 165-166, 日本語, 1345-3378, 201002245645084794
  • 密行列計算アルゴリズムに対するブロック分割法の最適化と性能評価
    深谷 猛; 山本 有作; 張 紹良
    高性能な行列計算を行う場合,プログラムの性能チューニングが必要不可欠である.我々は基本的な密行列計算が BLAS ルーチンを使って実行される点に着目し,チューニング済みの BLAS ルーチンを効率的に使えるようにプログラムをチューニングすることを目指す.ブロック化されたアルゴリズムにおいて,効率的に BLAS を使うためには行列のブロック分割法を最適化することが重要となる.本稿では,LU 分解のアルゴリズムをブロック化して,ブロック分割法が性能に与える影響を評価し,さらに適切な分割法を決定するための手法の検討を行う.For high performance matrix computations, it is necessity to tune the software. Since basic dense matrix computations consist almost entirely of the BLAS routines, it is important how to tune programs for exploiting the peak performance of optimized BLAS routines. In blocked algorithm, this means how to optimize the partitioning of the target matrix. In this paper, we evaluate and discuss the blocking strategy for the blocked LU decomposition., 情報処理学会, 出版日 2010年07月27日, 研究報告ハイパフォーマンスコンピューティング(HPC), 2010巻, 33号, 掲載ページ 1-6, 日本語, 0919-6072, 110007995521, AN10463942
  • 帯行列の固有値を計算する離散可積分系について
    福田亜希子; 石渡恵美子; 山本有作; 岩崎雅史; 中村佳正
    出版日 2010年03月, 九州大学応用力学研究所 研究集会報告 「非線形波動研究と将来 ― 次の10年への展望」, 21ME-S7巻, 掲載ページ 1-6, 日本語
  • On a variable transformation between two integrable systems: The discrete hungry Toda equation and the discrete hungry Lotka-Volterra system
    Y. Yamamoto; A. Fukuda; M. Iwasaki; E. Ishiwata; Y. Nakamura
    出版日 2010年, AIP Conference Proceedings, 1281巻, 掲載ページ 2045-2048, 英語, 査読付
  • ブロックハウスホルダーQR分解の並列計算における自動チューニング手法の検討
    深谷猛; 山本有作; ZHANG Shao‐Liang
    出版日 2009年10月15日, 情報処理学会研究報告(CD-ROM), 2009巻, 3号, 掲載ページ ROMBUNNO.HPC-121,18, 日本語, 2186-2583, 200902237723187860
  • Totally Nonnegative帯行列向けqd法へのシフト導入について
    山本有作; 深谷猛
    出版日 2009年09月28日, 日本応用数理学会年会講演予稿集, 2009巻, 掲載ページ 177-178, 日本語, 1345-3378, 200902203889947802
  • 離散ハングリー可積分系に基づく固有値計算アルゴリズムの新たな展開
    福田亜希子; 石渡恵美子; 山本有作; 岩崎雅史; 中村佳正
    出版日 2009年09月28日, 日本応用数理学会年会講演予稿集, 2009巻, 掲載ページ 235-236, 日本語, 1345-3378, 200902219801599854
  • 離散ハングリー可積分系に基づく帯行列の固有値計算アルゴリズムとその誤差評価
    福田亜希子; 石渡恵美子; 山本有作; 岩崎雅史; 中村佳正
    出版日 2009年09月28日, 日本応用数理学会年会講演予稿集, 2009巻, 掲載ページ 179-180, 日本語, 1345-3378, 200902242087749156
  • ブロックハウスホルダーQR分解の並列計算における自動チューニング手法の検討
    深谷 猛; 山本 有作; 張 紹良
    行列計算を並列化する場合,行列ベクトル積や行列乗算などの BLAS ルーチンを並列化する方法と,それらのルーチンをコールする階層で並列化する方法が考えられる.また,行列をブロックに分割して計算を行うことが一般的となっている.そのため,ユーザーは並列化方法とブロック分割法の両者のチューニングを行う必要があるが,自由度が非常に大きいため,効果的なチューニングをすることが難しい.そこで,本稿ではハウスホルダー QR 分解を対象として,自動チューニング手法の検討を行う.In matrix computation, we can parallelize an algorithm by two ways: parallelization of BLAS routines such as matrix-vector multiplication, and parallelization in algorithm levels where BLAS routines are called. In addition, blocking techniques are widely used for matrix computations. Therefore we have many choices when tuning our programs for parallel computers. But it is very difficult for general users to tune their programs effectively. In this paper, we discuss an approach to automatic tuning the algorithm of the blocked Householder QR decomposition., 情報処理学会, 出版日 2009年07月28日, 研究報告ハイパフォーマンスコンピューティング(HPC), 2009巻, 18号, 掲載ページ 1-7, 日本語, 1884-0930, 110007995413, AN10463942
  • 正方行列向け特異値分解のCUDAによる高速化
    深谷猛; 山本有作; 畝山多加志; 中村佳正
    出版日 2009年01月15日, 情報処理学会シンポジウム論文集, 2009巻, 2号, 掲載ページ 107-114, 日本語, 1344-0640, 200902293260151524
  • 長方行列向け特異値分解の浮動小数点コプロセッサによる高速化
    深谷 猛; 山本 有作; 畝山多加志; 堀 玄; 梅野 健
    本論文では,ClearSpeed社の浮動小数点コプロセッサCSX600を用いた長方行列の特異値分解の高速化について報告する.長方行列の特異値分解は,入力行列AのQR分解 A=QR,行列Rの二重対角化,二重対角行列の特異値分解,逆変換,QR分解の逆変換の5つのステップからなる.本研究では,この各部分においてlevel-3 BLASのDGEMM(行列乗算)を効率的に利用できるようにアルゴリズムをチューニングし,DGEMMの部分をCSX600で高速に実行する方式をとった.CSX600を2個搭載したボードを用いて本方式を実装し,様々なサイズの長方行列に適用した結果,40000×2000の行列の場合に,Xeon(3.2GHz)の2.3倍の性能が得られた.また,さらなる性能向上のための課題を明らかにした.In this paper, we propose an approach for accelerating the singular value decomposition (SVD) of a rectangular matrix with the CSX600 floating point coprocessor. The SVD of rectangular matrices consists of five steps, namely, QR decomposition of the input matrix A, transformation of R into a bidiagonal matrix, SVD of the resulting bidiagonal matrix, back-transformation and back-transformation corresponding to the QR decomposition. In our study, we optimize each step so that most of the computation is done using the level-3 BLAS (DGEMM) and accelerate the execution of DGEMM with the CSX600. We implemented the proposed method using an accelerator board with two CSX600 chips and obtained up to 2.3 times speedup over 3.2GHz Xeon processor when computing the SVD 40000×2000 rectangular matrix. Technical issues for further improving the performance are also discussed., 一般社団法人情報処理学会, 出版日 2007年05月15日, 情報処理学会論文誌コンピューティングシステム(ACS), 48巻, 8号, 掲載ページ 31-43, 日本語, 1882-7829, 110006274060, AA11833852
  • 長方行列向け特異値分解の浮動小数点コプロセッサによる高速化
    深谷猛; 山本有作; 畝山多加志; 堀玄, 梅野健
    出版日 2007年01月17日, 情報処理学会シンポジウム論文集, 2007巻, 1号, 掲載ページ 111-118, 日本語, 1344-0640, 200902222433133700
  • Accelerating the singular value decomposition of rectangular matrices with the CSX600 and the integrable SVD
    Y. Yamamoto; T. Fukaya; T. Uneyama; M. Takata; K. Kimura; M. Iwasaki; Y. Nakamura
    出版日 2007年, Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 4671 LNCS巻, 掲載ページ 340-345, 英語, 査読付, 200902269071311083

書籍等出版物

  • Advanced Mathematical Science for Mobility Society
    Masashi Iwasaki, Masato Shinjo, Yusaku Yamamoto, Akiko Fukuda, Sennosuke Watanabe, Masaki Sekiguchi
    分担執筆, Chapter: Integrable Systems Related to Matrix LR Transformations, Springer Singapore, 出版日 2023年11月, ISBN 9789819997718
  • 20世紀のトップ10アルゴリズム
    小柳義夫; 土谷隆; 曽我部知広; 杉原正顯; 西山博泰; 山本有作; 平田富夫; 大浦拓哉; 張紹良; 須田礼仁; 張紹良; 山本有作
    学術書, 日本語, 分担執筆, 第6章「QR法」、第9章「整数関係探知」(共訳)、第9章補遺「PSLQアルゴリズムの動作原理」, 共立出版, 出版日 2022年01月01日
  • ベクトル解析
    山本有作; 石原卓
    教科書・概説・概論, 日本語, 共著, 裳華房, 出版日 2020年11月18日
  • 計算科学のための基本数理アルゴリズム
    山本有作; 曽我部知広
    学術書, 日本語, 共著, 共立出版, 出版日 2019年06月01日, ISBN 9784320122666
  • The Art of High Performance Computing for Computational Science, Vol. 1
    Takahiro Katagiri; Maho Nakata; Yusaku Yamamoto; Daisuke Takahashi; Hiroshi Watanabe; Shin’chi Oishi; Yusuke Morikura; Kouta Sekine; Hisayasu Kuroda
    学術書, 英語, 分担執筆, High-Performance Algorithms for Numerical Linear Algebra, Springer, 出版日 2019年05月23日
  • 数値線形代数の数理とHPC (シリーズ応用数理 第 6巻)
    山本 有作
    学術書, 日本語, 分担執筆, 第1章「連立一次方程式の数値解法」, 共立出版, 出版日 2018年08月30日, ISBN 9784320019553
  • Eigenvalue Problems: Algorithms, Software and Applications in Petascale Computing
    Yusaku Yamamoto
    学術書, 英語, 分担執筆, Article: An elementary derivation of the projection method for nonlinear eigenvalue problems based on complex contour integration, Springer, 出版日 2018年01月04日, ISBN 9783319624242
  • 計算科学のためのHPC技術1
    片桐孝洋; 中田真秀; 渡辺宙志; 山本有作; 吉井範行; Jaewoon Jung; 杉田有治; 石村和也; 大石進一; 関根晃太; 森倉悠介; 黒田久泰
    学術書, 日本語, 分担執筆, 第8章 行列計算における高速アルゴリズム, 大阪大学出版会, 出版日 2017年03月01日, ISBN 9784872595864
  • ストラング:計算理工学
    Gilbert Strang
    学術書, 日本語, 分担執筆, 第1章 応用線形代数, 近代科学社, 出版日 2017年01月30日
  • 応用数理ハンドブック
    山本有作
    事典・辞書, 日本語, 分担執筆, 第II編「方法の数理」中,「固有値問題の数値解法」, 朝倉書店, 出版日 2013年10月25日

講演・口頭発表等

  • Comparison of Two QUBO Formulations of Approximate Block Diagonalization and Their Performance on the D-Wave Advantage Quantum Annealing Machine
    Koushi Teramoto; Shuhei Kudo; Yusaku Yamamoto
    口頭発表(一般), 英語, 15th International Conference on Parallel Processing & Applied Mathematics, 査読付
    発表日 2024年09月10日
  • Picard逐次近似法とGauss-Seidel法
    山本有作
    口頭発表(一般), 日本語, 第50回数値解析シンポジウム
    発表日 2024年06月13日
  • Approximate Block Diagonalization of Symmetric Matrices Using Quantum Annealing
    Koushi Teramoto; Masaki Kugaya; Shuhei Kudo; Yasuhiko Takenaga; Yusaku Yamamoto
    口頭発表(一般), 英語, International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia '24), 査読付
    発表日 2024年01月26日
  • Approximate block diagonalization of symmetric matrices using a quantum annealing
    Koushi Teramoto; Shuhei Kudo; Yusaku Yamamoto
    口頭発表(一般), 英語, 2023 International Congress on Industrial and Applied Mathematics (ICIAM 2023)
    発表日 2023年08月24日
    開催期間 2023年08月20日- 2023年08月25日
  • Computing the matrix sign function with the double exponential formula
    Tomoya Miyashita; Shuhei Kudo; Yusaku Yamamoto
    口頭発表(一般), 英語, 2023 International Congress on Industrial and Applied Mathematics (ICIAM 2023)
    発表日 2023年08月23日
    開催期間 2023年08月20日- 2023年08月25日
  • Landau–Lifshitz–Gilbert 方程式に対する数値解法の構造保存性について
    山本有作; 慈道亮人; 工藤周平
    口頭発表(一般), 日本語, 第49回数値解析シンポジウム(NAS2023)
    発表日 2023年07月13日
    開催期間 2023年07月12日- 2023年07月14日
  • 2本のベクトルが張る平面上での回転による直交変換
    森健太; 山本有作; 工藤周平
    口頭発表(一般), 日本語, 日本応用数理学会 2023年研究部会連合発表会
    発表日 2023年03月10日
    開催期間 2023年03月08日- 2023年03月10日
  • q-離散戸田方程式の拡張とその時間発展が与えるLR変換について
    渡邉凌斗; 新庄雅斗; 山本有作; 岩崎雅史
    口頭発表(一般), 日本語, 日本応用数理学会 2023年研究部会連合発表会
    発表日 2023年03月10日
    開催期間 2023年03月08日- 2023年03月10日
  • 二重指数関数型数値積分公式を用いた行列符号関数計算法の精度および並列性の検証
    宮下朋也; 山本有作; 工藤周平
    口頭発表(一般), 日本語, 日本応用数理学会 2023年研究部会連合発表会
    発表日 2023年03月10日
    開催期間 2023年03月08日- 2023年03月10日
  • 固有値計算法で解く連続時間可積分系
    山本有作
    公開講演,セミナー,チュートリアル,講習,講義等, 日本語, 武蔵野大学MCMEセミナー, 招待, 武蔵野大学, 武蔵野大学有明キャンパス, https://www.musashino-u.ac.jp/research/laboratory/mathematical_engineering/seminar_symposium.html
    開催期間 2023年01月17日
  • 行列計算における確率的誤差解析 ~ 行列指数関数の計算を例として ~
    山本有作
    公開講演,セミナー,チュートリアル,講習,講義等, 日本語, 日本応用数理学会 第14回 三部会連携「応用数理セミナー」, 招待, 日本応用数理学会, オンライン, https://na.cs.tsukuba.ac.jp/mepa/?page_id=2264
    開催期間 2022年12月23日
  • 量子力学の固有値問題に対する緒方の方法の加速について
    山本有作,今倉暁,緒方秀教
    口頭発表(一般), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第34回研究会, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会, オンライン, https://na.cs.tsukuba.ac.jp/mepa/?page_id=2427
    開催期間 2022年12月06日
  • Automatic code selection for the dense symmetric generalized eigenvalue problem using ATMathCoreLib
    Masato Kobayashi; Takeo Hoshi; Yusaku Yamamoto
    口頭発表(一般), 英語, The 14th International Conference on Parallel Processing and Applied Mathematics (PPAM 2022), 国際会議
    発表日 2022年09月12日
  • 量子力学固有値問題の数値不定積分による数値解法
    緒方秀教; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会2022年度年会, 国内会議
    発表日 2022年09月10日
  • 線形一般固有値問題に対する非線形べき乗法の収束解析
    山本有作; 緒方秀教
    口頭発表(一般), 日本語, 日本応用数理学会2022年度年会, 国内会議
    発表日 2022年09月08日
  • 二重指数関数型数値積分公式を用いた行列符号関数の計算の改良および応用
    宮下朋也; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会2022年度年会, 国内会議
    発表日 2022年09月08日
  • 運搬車容量付きの箱に番号が付いた箱玉系とシフト付きLR変換との対応
    西脇友哉; 福田亜希子; 山本有作; 岩﨑雅史
    口頭発表(一般), 日本語, 日本応用数理学会2022年度年会, 国内会議
    発表日 2022年09月08日
  • Mobility and Eigenvalue/Singular Value Problems: Applications and Numerical Computation
    Yusaku Yamamoto
    口頭発表(招待・特別), 英語, Mobility Workshop 2022 in Shizuoka: Mathematical Approaches to Mobility Problems, 招待, Network Machine Learning Team, Advanced Mathematical Science for Mobility Society Unit, Kyoto Univ.; Mathematical Informatics Lab, NAIST, Parche (Room C), Shizuoka City, https://sites.google.com/view/milab/home/mobility-workshop-2022-invited-only, 国際会議
    発表日 2022年01月17日
  • ブロック赤黒順序付けを用いた摂動付きMIC(0)分解のモデル問題による収束性解析
    塩谷明美; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第32回研究会, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会, オンライン, 国内会議
    発表日 2021年12月10日
  • ベイズ推定による超並列計算の性能予測
    星健夫; 小橋恒士; 山本有作; 深谷猛
    口頭発表(一般), 日本語, 日本応用数理学会2020年度年会, 日本応用数理学会, オンライン, 国内会議
    発表日 2021年09月09日
  • 離散相対論的戸田方程式から導かれる交通流モデル
    関口真基; 岩崎雅史; 山本有作; 石渡恵美子
    ポスター発表, 日本語, 日本応用数理学会2020年度年会, 日本応用数理学会, オンライン, 国内会議
    発表日 2021年09月08日
  • 原点シフト付きロトカ・ボルテラ系に対する超離散化から得られる箱玉系の性質について
    岡来美; 関口真基; 岩﨑雅史; 山本有作; 石渡恵美子
    ポスター発表, 日本語, 日本応用数理学会2020年度年会, 日本応用数理学会, オンライン, 国内会議
    発表日 2021年09月08日
  • ブロック赤黒順序付けされた摂動付き修正不完全分解前処理の収束性解析
    塩谷明美; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会2020年度年会, 日本応用数理学会, 国内会議
    発表日 2021年09月07日
  • テイラー展開に基づく行列指数関数計算の誤差解析
    山本有作; 工藤周平; 星健夫
    口頭発表(一般), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第31回研究会, 日本応用数理学会, オンライン, 国内会議
    発表日 2021年07月20日
  • ヒルベルト行列と関連するある行列の固有値について
    山本 有作
    口頭発表(一般), 日本語, 日本応用数理学会 第17回研究部会連合発表会, 日本応用数理学会, 国内会議
    発表日 2021年03月04日
  • ヒルベルト行列と関連するある行列の 固有値について
    山本 有作
    口頭発表(一般), 日本語, 日本応用数理学会 第17回研究部会連合発表会, 日本応用数理学会, 国内会議
    発表日 2021年03月04日
  • 縦長行列の列ピボット付きQR分解に対するコレスキーQR型アルゴリズムの検討
    深谷猛; 中務祐治; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会2020年度年会, 日本応用数理学会, Zoom開催, 国内会議
    発表日 2020年09月09日
  • 実対称固有値問題向けのブロックヤコビ法に対する組み合わせ的前処理
    久賀谷匡貴; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第29回研究会, 日本応用数理学会, Zoom開催, 国内会議
    発表日 2020年07月30日
  • Shifted CholeskyQR3 for High Performance Tall-Skinny QR Factorization
    Takeshi Fukaya; Ramaseshan Kannan; Yuji Nakatsukasa; Yusaku Yamamoto; Yuka Yanagisawa
    口頭発表(一般), 英語, 2020 SIAM Conference on Parallel Processing for Scientific Computing, Society for Industrial and Applied Mathematics, Seattle, WA
    発表日 2020年02月13日
  • Performance improvement of block red-black MILU(0) preconditioner with relaxation on GPU
    Akemi Shioya; Yusaku Yamamoto
    ポスター発表, 英語, HPC Asia 2020, Across Fukuoka, 国際会議
    発表日 2020年01月16日
  • エネルギー散逸型数値解法の設計におけるある逆固有値問題について
    山本 有作
    口頭発表(一般), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第28回研究会, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会, 東京, 国内会議
    発表日 2019年12月02日
  • エネルギー散逸型数値解法の 設計におけるある逆固有値問題について
    山本 有作
    口頭発表(一般), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第28回研究会, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会, 東京, 国内会議
    発表日 2019年12月02日
  • Efficient implementations of the modified Gram–Schmidt orthogonalization in a non-standard inner product
    Yusaku Yamamoto
    口頭発表(一般), 英語, PARNUM 2019
    発表日 2019年10月28日
  • 一般内積における直交化のためのMGS-HP法の誤差解析
    山本有作; 今倉暁
    口頭発表(一般), 日本語, 日本応用数理学会2019年度年会, 日本応用数理学会, 東京大学駒場キャンパス, 国内会議
    発表日 2019年09月05日
  • 離散相対論的戸田方程式が与えるシフト付きLR変換について
    簑下尚也; 岩崎雅史; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会2019年度年会, 日本応用数理学会, 東京大学駒場キャンパス, 国内会議
    発表日 2019年09月05日
  • ブロック赤黒順序付け緩和MILU(0)前処理法のGPU向け高速化
    塩谷明美; 山本有作
    ポスター発表, 日本語, 日本応用数理学会2019年度年会, 日本応用数理学会, 東京大学駒場キャンパス, 国内会議
    発表日 2019年09月04日
  • 超並列電子状態計算に対するベイズ推定型計算性能解析
    星健夫; 角田皓亮; 田中和; 深谷猛; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会2019年度年会, 日本応用数理学会, 東京大学駒場キャンパス, 国内会議
    発表日 2019年09月03日
  • ブロック赤黒順序付け緩和MILU(0)前処理法のGPU実装と性能評価
    塩谷明美; 山本有作
    口頭発表(一般), 日本語, 2019年並列/分散/協調処理に関する『北見』サマー・ワークショップ (SWoPP2019), 北見市民会館, 国内会議
    発表日 2019年07月25日
  • 荻田・相島の固有ベクトル反復改良法に基づく実対称行列の固有値分解追跡手法
    山本 有作
    口頭発表(一般), 日本語, RIMS共同研究(公開型)「次世代の科学技術を支える数値解析学の基盤整備と応用展開」, 京都大学数理解析研究所, 国内会議
    発表日 2018年11月14日
  • Orthogonalization algorithms and dense symmetric eigenvalue solvers optimized for strong scaling
    Yusaku Yamamoto
    口頭発表(招待・特別), 英語, 3rd International Symposium on Research and Education of Computational Science (RECS2018), 招待, The Computational Science Alliance of the University of Tokyo, The University of Tokyo, http://conf.compsci-alliance.jp/program/, 国際会議
    発表日 2018年09月20日
  • 荻田・相島の固有ベクトル反復改良法における重複固有値の扱いについて
    白間 久瑠美; 工藤 周平; 山本 有作
    口頭発表(一般), 日本語, 日本応用数理学会2018年度年会, 日本応用数理学会, 名古屋大学, http://annual2018.jsiam.org/, 国内会議
    発表日 2018年09月04日
  • ベイズ推定を用いた並列数値計算ライブラリの性能予測
    原田 祐希; 田中 和幸; 福本 智哉; 深谷 猛; 山本 有作; 星 健夫
    ポスター発表, 日本語, 日本応用数理学会2018年度年会, 日本応用数理学会, 名古屋大学, http://annual2018.jsiam.org/, 国内会議
    発表日 2018年09月04日
  • シフト付きCholeskyQR法を用いた一般内積空間におけるQR分解の計算
    深谷 猛; 中務 佑治; Kannan Ramaseshan; 山本 有作; 柳澤 優香
    ポスター発表, 日本語, 日本応用数理学会2018年度年会, 日本応用数理学会, 名古屋大学, http://annual2018.jsiam.org/, 国内会議
    発表日 2018年09月04日
  • 一般化固有値問題に対する分割統治法におけるデフレーション手法について
    廣田 悠輔; 山本 有作
    口頭発表(一般), 日本語, 2018年並列/分散/協調処理に関する『熊本』サマー・ワークショップ (SWoPP2018), 電子情報通信学会・情報処理学会・日本応用数理学会, 熊本県熊本市, https://sites.google.com/site/swoppweb/, 国内会議
    発表日 2018年07月31日
  • Relaxed MILU(0) Factorization with Block Red-Black Ordering for GPU parallelization of PIC simulation
    Akemi Shioya; Yusaku Yamamoto
    口頭発表(一般), 英語, EASIAM2018, SIAM East Asian Section, The University of Tokyo, http://sr3.t.u-tokyo.ac.jp/EASIAM2018/, 国際会議
    発表日 2018年06月25日
  • Application of an energy-preserving integrator to quantum-mechanical wavepacket dynamics
    Tsubasa Sakai; Shuhei Kudo; Hiroto Imachi; Yuto Miyatake; Takeo Hoshi; Yusaku Yamamoto
    口頭発表(一般), 英語, EASIAM2018, SIAM East Asian Section, The University of Tokyo, http://sr3.t.u-tokyo.ac.jp/EASIAM2018/, 国際会議
    発表日 2018年06月24日
  • エネルギー保存型並列解法MB4に基づ2次元量子ダイナミクス計算
    酒井 翼; 工藤 周平; 井町 宏人; 宮武 勇登; 星 健夫; 山本 有作
    ポスター発表, 日本語, 第47 回数値解析シンポジウム(NAS2018), 福井県あわら市, 国内会議
    発表日 2018年06月07日
  • A case study on modeling the performance of dense matrix computation: tridiagonalization in the EigenExa eigensolver on the K computer
    Takeshi Fukaya; Toshiyuki Imamura; Yusaku Yamamoto
    口頭発表(一般), 英語, IPDPS Workshops 2018, IPDPS, Vancouver, Canada, 国際会議
    発表日 2018年05月21日
  • Block Red-Black Milu(0) Preconditioner with Relaxation on GPU
    Akemi Shioya; Yusaku Yamamoto
    口頭発表(一般), 英語, 18th SIAM Conference on Parallel Processing for Scientific Computing, Society of Industrial and Applied Mathematics, Tokyo, Japan, 国際会議
    発表日 2018年03月09日
  • Orthogonalization Algorithms and Dense Symmetirc Eigenvalue Solvers for Massively Parallel Machines
    Yusaku Yamamoto
    口頭発表(一般), 英語, International Workshop on Massively Parallel Programming for Quantum Chemistry and Physics 2018, 招待, 理化学研究所 計算科学研究機構 (量子系分子科学研究チーム) 理化学研究所 理論科学連携研究推進グループ (iTHES) 超並列プログラミング国際WS実行委員会, 理化学研究所(埼玉県和光市), http://labs.aics.riken.jp/nakajimat_top/mpqcp2018_ws.html, 国際会議
    発表日 2018年01月16日
  • One-Way Dissectionオーダリングによる連立一次方程式の直接解法の並列化
    中野 智輝; 横川 三津夫; 深谷 猛; 山本 有作
    口頭発表(一般), 日本語, 情報処理学会第162回ハイパフォーマンスコンピューティング研究発表会, 国内会議
    発表日 2017年12月19日
  • 虚数シフトを行った実対称行列のためのCOCG法と一般化MINRES法の性能比較
    清藤 博暉; 山本 有作
    口頭発表(一般), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第24回研究会, 日本応用数理学会, 国内会議
    発表日 2017年11月24日
  • On using the Cholesky QR method in the full-blocked one-sided Jacobi algorithm
    S. Kudo; Y. Yamamoto
    口頭発表(一般), 英語, The 12th International Conference on Parallel Processing and Applied Mathematics (PPAM 2017), Lublin, Poland, https://www.ppam.pl/program, 国際会議
    発表日 2017年09月11日
  • Cholesky QR法を用いたブロック片側ヤコビ法の誤差解析
    工藤周平; 山本有作
    口頭発表(一般), 日本語, SWoPP 2017, 日本応用数理学会, 国内会議
    発表日 2017年07月27日
  • ブロック赤-黒順序付けされた摂動/緩和MILU(0)前処理法のGPUとマルチコアCPUにおける性能評価
    塩谷明美; 山本有作
    口頭発表(一般), 日本語, SWoPP 2017, 国内会議
    発表日 2017年07月27日
  • 一般内積における直交化のためのMGS-HP 法の誤差解析
    山本有作
    口頭発表(一般), 日本語, 第46回数値解析シンポジウム(NAS2017), 国内会議
    発表日 2017年06月30日
  • Roundoff error analysis of the CholeskyQR2 and related algorithms
    Yusaku Yamamoto
    口頭発表(一般), 英語, International Workshop on Parallel Numerics (PARNUM 2017), Waischenfeld, Germany, 国際会議
    発表日 2017年04月20日
  • 一般内積に対する修正グラム・シュミット直交化の効率的実装法の誤差解析
    山本有作; 今倉暁
    口頭発表(一般), 日本語, 日本応用数理学会 2017年 研究部会連合発表会, 電気通信大学
    発表日 2017年03月06日
  • 片側ヤコビSVDの並列計算機向け実装と性能解析
    工藤周平; 山本有作
    口頭発表(一般), 日本語, 日本応用数理学会 2017年 研究部会連合発表会, 電気通信大学, 国内会議
    発表日 2017年03月06日
  • ブロックヤコビ法に基づく強スケーリング型固有値・特異値計算アルゴリズム
    山本 有作
    口頭発表(招待・特別), 日本語, 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第22回研究会, 東京大学, 国内会議
    発表日 2016年11月25日
  • Convergence Analysis of the Parallel Block Jacobi Method for the SVD with Dynamic Ordering
    Yusaku Yamamoto
    口頭発表(招待・特別), 英語, Parallel Numerical Computing and Its Applications, 招待, Slovak Academy of Sciences, Bratislava, Slovakia, Smolenice, Slovakia, 国際会議
    発表日 2016年09月07日
  • ブロック化赤-黒順序付けにおけるMILU分解の問題点と緩和係数導入の効果
    塩谷明美; 山本有作
    口頭発表(一般), 日本語, SWoPP 2016, (社)情報処理学会, キッセイ文化ホール(長野県松本文化会館), 国内会議
    発表日 2016年08月09日
  • High-Performance Parallelization Method of DSYRK for SVD and other Matrix Computations on Xeon Phi
    Shuhei Kudo; Yusaku Yamamoto
    口頭発表(一般), 英語, The 9th International Workshop on Parallel Matrix Algorithms and Applications (PMAA 16), 国際会議
    発表日 2016年07月07日
  • Solution of a Nonlinear Eigenvalue Problem using the Signed Singular Values with Application to the Scaling Exponent Computation in 2 Dimensional Turbulent Flow
    Yusaku Yamamoto
    口頭発表(一般), 英語, SIAM: East Asian Section Conference 2016 (EASIAM 2016), Society of Industrial and Applied mathematics, 国際会議
    発表日 2016年06月21日
  • Xeon PhiにおけるDSYRKの並列化手法と性能解析
    工藤周平; 山本有作
    口頭発表(一般), 日本語, 2016年ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2016), (社)情報処理学会, 東北大学片平キャンパス, 国内会議
    発表日 2016年06月06日
  • Performance of the Parallel One-Sided Block Jacobi SVD Algorithm on a Modern Distributed-Memory Parallel Computer
    S. Kudo; Y. Yamamoto; M. Bečka; M. Vajteršic
    口頭発表(一般), 英語, 11th International Conference on Parallel Processing and Applied Mathematics (PPAM 2015), Krakow, Poland, 国際会議
    発表日 2015年09月08日
  • 三重対角化に対するDongarra--Wilkinson法の性能解析と実装手法について
    工藤周平; 山本有作; 横川三津夫
    口頭発表(一般), 日本語, 2015年ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2015), (社)情報処理学会, 東京大学, 国内会議
    発表日 2015年05月19日
  • A nonlinear eigenvalue problem arising in theoretical fluid dynamics and its solution using signed singular values
    Yusaku Yamamoto
    口頭発表(招待・特別), 英語, The Fifth China-Japan- Korea Conference on Numerical Mathematics, 招待, Yinchuan City, Ningxia Province, China, 国際会議
    発表日 2014年08月25日
  • 固有値計算のための古典的ブロックヤコビ法の並列化とその収束性解析
    山本有作; 張瀾
    口頭発表(一般), 日本語, 日本応用数理学会 研究部会連合発表会, 日本応用数理学会, 京都大学, http://chaosken.amp.i.kyoto-u.ac.jp/jsiam2014spring/program.html, 国内会議
    発表日 2014年03月20日
  • エクサフロップス時代に向けた線形計算アルゴリズムの課題と研究動向
    山本有作
    口頭発表(招待・特別), 日本語, 日本応用数理学会 研究部会連合発表会, 招待, 日本応用数理学会 「行列・固有値問題とその応用」研究部会, 東京大学, http://na.cs.tsukuba.ac.jp/mepa/?page_id=331, 国内会議
    発表日 2013年12月26日
  • Solution of a Large-Scale Nonlinear Eigenvalue Problem Based on the Signed Singular Values
    Yusaku Yamamoto
    口頭発表(招待・特別), 英語, 2013 NCTS Workshop on Numerical Linear Algebra and High Performance Computing, NCTS, National Tsing-Hua University,, Hsinchu, China, http://math.cts.nthu.edu.tw/Mathematics/2013NLA-HPC.htm, 国際会議
    発表日 2013年12月09日

担当経験のある科目_授業

  • 情報数理工学実験第二
    電気通信大学
  • 情報数理工学実験第二
    電気通信大学
  • ハイパフォーマンスコンピューティング基礎論
    電気通信大学
  • ハイパフォーマンスコンピューティング基礎論
    電気通信大学
  • ハイパフォーマンスコンピューティング
    電気通信大学
  • ハイパフォーマンスコンピューティング
    電気通信大学
  • 応用数学第二
    電気通信大学
  • 応用数学第二
    電気通信大学
  • Basics of High Performance Computing
    The University of Electro-Communications
  • HPC基礎論
    電気通信大学
  • High Performance Computing 1
    The University of Electro-Communications
  • HPC第一
    電気通信大学
  • High Performance Computing 2
    The University of Electro-Communications
  • HPC第二
    電気通信大学

所属学協会

  • 2004年01月 - 現在
    日本応用数理学会

共同研究・競争的資金等の研究課題

  • 組合せ的前処理と量子アニーリングの融合による行列計算の加速手法
    山本 有作; 武永 康彦
    日本学術振興会, 科学研究費助成事業 挑戦的研究(萌芽), 電気通信大学, 挑戦的研究(萌芽), 22K19772
    研究期間 2022年06月30日 - 2025年03月31日
  • 汎用表面構造解析プログラム「2DMAT」高度化に向けての調査研究II
    望月出海; 和田 健; 兵頭 俊夫; アハメッド レズワン; 福島 孝治; 吉見 一慶; 花田 貴; 平川 力; 星建夫; 高山あかり; 中西義典; 山本有作
    2023 年度TIA 連携プログラム探索推進事業「かけはし」, 高エネルギー加速器研究機構, TK23-006
    研究期間 2023年04月 - 2024年03月
  • 高いスケーリング性能と高精度性を併せ持つ次世代固有値・特異値分解ライブラリの開発
    山本有作
    研究期間 2019年04月01日 - 2023年03月31日
  • 非直交変換に基づく高速・高精度・安定な行列計算アルゴリズムの設計手法の確立
    山本 有作; 廣田 悠輔
    日本学術振興会, 科学研究費助成事業, 電気通信大学, 挑戦的研究(萌芽), 本研究では,非直交変換を用いた新しい行列計算アルゴリズムを開発し,その収束性や精度を理論的に解析することを目的として研究を行った。研究対象として時間依存固有値問題の数値解法,および連立1次方程式の反復解法のための前処理法を取り上げ,前者については,行列乗算を中心とする次世代プロセッサに適したアルゴリズム,後者については,修正不完全コレスキー分解ブロック赤黒順序付けに基づく高並列型の解法を開発した。, 17K19966
    研究期間 2017年06月30日 - 2022年03月31日
  • 強スケーリング性能を指向した計算物理向け超並列行列計算ライブラリの開発
    山本 有作; 横川 三津夫; 星 健夫
    日本学術振興会, 科学研究費助成事業, 電気通信大学, 基盤研究(B), 本研究では,電子状態計算,プラズマシミュレーション,亀裂進展シミュレーションなど計算物理の様々な分野に適用可能な行列計算ソルバを開発した。特に,疎行列および帯行列向けの連立1次方程式直接解法と密行列向けの一般固有値解法を中心とし,同期点の少ないアルゴリズムの採用や計算機環境に応じたアルゴリズムの自動選択などにより,高い強スケーリング性能を目指した。また,開発したソルバを有機高分子系の時間発展シミュレーションや亀裂進展シミュレーションに適用し,効果を確認した。, 17H02828
    研究期間 2017年04月01日 - 2020年03月31日
  • 数理構造の抽出と保存を中心とした次世代エレクトロニクス材料設計基盤の創出
    松尾 宇泰; 山本 有作; 多田 朋史; 宮武 勇登; 星 健夫
    日本学術振興会, 科学研究費助成事業, 東京大学, 基盤研究(B), 本研究では複雑化・巨大化し従来の設計プロセスでは限界に達しつつある次世代エレクトロニクス材料の新設計基盤の創出を目指して,数理構造の一貫性に基づく物理・数理モデル・数値計算の一体化した計算体系を探究した.その結果,構造保存的モデル縮減法の新規開発・検証,量子ダイナミクス計算のための高速な反復法の開発など,重要な要素技術開発を行ったあと,総合応用技術としてエネルギー保存型並列解法による量子ダイナミクス計算を行い本研究理念の実現性と有用性を確かめた., 16KT0016
    研究期間 2016年07月19日 - 2019年03月31日
  • O(1億)コア環境におけるスケーラブルな数値計算ソフトウェアの理論と応用
    今村 俊幸; 大井 祥栄; 深谷 猛; 廣田 悠輔; 椋木 大地; 山本 有作; 藤堂 眞治
    日本学術振興会, 科学研究費助成事業, 国立研究開発法人理化学研究所, 基盤研究(B), 本研究は、数万から数億のコアプロセッサが搭載される計算システム環境下において、過去に蓄積された高性能な数値計算サービスを新しい数学原理に基づき実現することを目的にし、「異粒度数値カーネル構築」と共に「非同期的な数値計算アルゴリズム」の2大テーマのもと、1)非同期的数値計算アルゴリズムに関する理論と実用レベルにある省通信・省同期アルゴリズムについて研究しCAHTRやFDTD向けの手法を提案した。更に、2)超メニイコアでのスケーラブルな軽量コード生成のための自動チューニングなどの核基盤技術研究を推進し次世代数値計算ソフトウェアの新技術創出に繋がる新機軸探究を進めた。, 15H02709
    研究期間 2015年04月01日 - 2018年03月31日
  • 複合的・階層的な自動チューニングを実現する数理基盤手法の研究とライブラリの開発
    須田 礼仁; 藤井 昭宏; 美添 一樹; 田中 輝雄; 山本 有作; 片桐 孝洋
    日本学術振興会, 科学研究費助成事業, 東京大学, 基盤研究(B), 自動チューニングは、ソフトウェアが内包するパラメタを自ら調整し、多様な条件下で良好な性能を達成することを目指す技術である。従来、複数のパラメタの調整が必要な場合、網羅試行か経験的枝刈りが広く用いられてきたが、本研究では、ベイズ統計に基づき、現実的に有効かつ漸近的に最適解を導く数理的手法を目指した。 従来研究の調査により、線形モデルと相関モデルが使われており、両者は同時に使うこともできることを示した。そのようなモデルを記述から、事前情報と実測結果から性能モデルを構築するプログラムを自動生成する仕組みを構築した。また、自動チューニング数理ライブラリの多様な計算に適用し、その有効性を確認した。, 15H02708
    研究期間 2015年04月01日 - 2018年03月31日
  • 可積分系を起源とする行列の相似変形に関する新展開
    岩崎 雅史; 山本 有作; 石渡 恵美子; 近藤 弘一; 福田 亜希子; 新庄 雅斗
    日本学術振興会, 科学研究費助成事業, 京都府立大学, 基盤研究(C), 1つ目の研究成果は特異値分解アルゴリズムI-SVDの高精度化である。具体的には、特異値を求めるためにdLVsアルゴリズムを、特異ベクトルを求めるために分割型ツイスト分解法を新たに考案した。2つ目の研究成果は帯行列の固有値に収束するような力学系を導いたことである。離散ハングリー可積分系については解表現とその漸近挙動を徹底的に調べた。新たに5重対角行列の固有値が求められるアルゴリズムも定式化した。3つ目の研究成果は離散ハングリー可積分系と拡張型フィボナッチ数列および多項式の根を関連付け、逆固有値問題に対する解法まで発展させたことである。また、min-plus代数において新しい固有多項式を提案した。, 26400208
    研究期間 2014年04月01日 - 2017年03月31日
  • 電子状態計算への応用を指向した行列計算ライブラリの機能拡張とメニーコア向け最適化
    山本有作
    研究代表者, 大規模電子状態計算向けに行列計算ライブラリを拡張し,電子状態計算向けの固有値解法,ベクトルの逐次添加型直交化法,行列関数の計算法などの機能を備える。また,開発したライブラリをメニーコアプロセッサ向けに最適化する。
    研究期間 2014年04月01日 - 2017年03月31日
  • 汎用自動チューニング機構を実現するためのソフトウェア基盤の研究
    須田 礼仁; 佐藤 周行; 山本 有作; 今村 俊幸; 美添 一樹; 片桐 孝洋; 藤井 昭宏; 弓場 敏嗣; 八杉 昌宏; 大澤 範高; 鴨志田 良和
    日本学術振興会, 科学研究費助成事業, 東京大学, 基盤研究(A), 自動チューニング(AT)を汎用的技術として確立することをめざし、以下の4領域にて研究を行った。数理領域では、AT数理コアライブラリATMathCoreLibを開発・公開、また性能相関を扱う数理手法を開発した。プログラミング領域では、上記ライブラリをAT記述言語ppOpen-ATに組込み、またコード配置の偶発性による性能変化を打ち消す手法を提案。システム領域では汎用的Auto-Tunerの構成法提示、また性能情報取得を軽量化した。アプリケーション領域では行列計算・大規模探索のAT、上記ライブラリのアプリに適用した。このように4領域を連携しつつ集中的に研究、ATの汎用技術化に向けて成果を挙げた。, 23240005
    研究期間 2011年04月01日 - 2015年03月31日
  • 計算物質科学の基盤となる超大規模系のための高速解法
    張 紹良; 阿部 邦美; 山本 有作; 曽我部 知広; 今堀 慎治; 宮田 考史; 杉原 正顯
    日本学術振興会, 科学研究費助成事業, 名古屋大学, 新学術領域研究(研究領域提案型), 物質デザインコンピューティクスに現れる様々な超大規模系の数理的諸特徴を研究すると同時に,最新の計算機を高度に駆使することが可能な高速解法の総合的開発を目的し,大規模線形方程式の数値解法(Shifted COCR法,the Look-Back GMRES(m)法など)および大規模固有値問題の数値解法(Arnoldi(M,W,G)法,SS法の拡張)の開発を行った.これらは解法によっては高並列化が可能であることや物理問題に特化した解法であることから当初の目的を達成したといえる., 22104004
    研究期間 2010年04月01日 - 2015年03月31日
  • メニーコア時代に向けた高速・高精度固有値計算アルゴリズムの開発
    山本 有作
    日本学術振興会, 科学研究費助成事業, 神戸大学, 基盤研究(C), 本課題では,メニーコアプロセッサの性能を引き出す固有値計算アルゴリズムの開発を目的として研究を行った.本研究の主な成果は次の通りである. (1) マルチコア/メニーコア向け固有値計算アルゴリズムの実装と性能評価 (2) AllReduce 型ハウスホルダーQR 分解法の誤差解析 (3) 高い並列性を持つベクトル逐次添加型直交化アルゴリズムの開発 (4) Totally Nonnegative 帯ヘッセンベルグ行列向けの高精度固有値計算アルゴリズムの開発, 21560065
    研究期間 2009年 - 2012年
  • マルチコア複合環境を指向した適応型自動チューニング技術
    今村 俊幸; 片桐 孝洋; 須田 礼仁; 高橋 大介; 山本 有作; 中島 研吾
    日本学術振興会, 科学研究費助成事業, 電気通信大学, 基盤研究(B), マルチコアCPU・マルチGPUなど次世代スパコンのプロセッサでの高性能計算を恒常的に維持するための重要な要素「自動チューニング技術」の確立を目的として研究を推進した.「GPUでの性能安定化技法を取り込んだ自動チューニング技術」と「性能データベースを活用する自動チューニング方式」を提案した.さらに,動的に変動する条件に適応する自動チューニングの数理手法の研究を通じベイズモデルに基づく準最適実験計画を与えることに成功した.クラスタ計算ならびにマルチコア計算機での固有値計算、高速フーリエ変換、前処理付反復ソルバに関して自動チューニング技術の応用を実施した., 21300013
    研究期間 2009年 - 2011年
  • マルチコアプロセッサに対応した革新的特異値分解ライブラリの開発
    中村 佳正; 辻本 諭; 木村 欣司; 山本 有作; 岩崎 雅史; 高田 雅美
    日本学術振興会, 科学研究費助成事業, 京都大学, 基盤研究(A), マルチコア計算機環境における並列計算において, 1)上2重対角行列の特異値計算のための一般化Newtonシフトに基づくmdLVsアルゴリズムのシフト戦略の完成, 2) compact WY表現を用いたHouseholder変換による特異ベクトル再直交化部の高速化, 3)与えられた密行列から上2重対角行列への前処理部の高速化, 4) I-SVDおよびD & C等の特異値分解アルゴリズムのGPGPU上の倍精度計算に関する性能・精度評価, 5)可積分アルゴリズムの適用範囲を2重対角行列から帯行列の固有値・特異値計算に広げる等も進展があった.これらの成果について,精力的に国際会議・学会発表,論文発表するとともに,成果1)-4)によってさらに高速化されたI-SVD法の実装コードDBDSLVのウェブページ公開を行った., 20246027
    研究期間 2008年 - 2011年
  • 可積分系アプローチによる新しいアルゴリズムの探求
    岩崎 雅史; 近藤 弘一; 石渡 恵美子; 山本 有作; 中村 佳正
    日本学術振興会, 科学研究費助成事業, 京都府立大学, 若手研究(B), 可積分系研究に基づき、3種類の新しいアルゴリズムを定式化した。具体的には、帯行列の固有値を求めるためのアルゴリズム、ニュートン法に基づく行列の対角化アルゴリズム、Max-Plus代数における行列の固有値を求めるためのアルゴリズム、を定式化した。さらに、本研究で得られたアルゴリズムに加えて、既存のアルゴリズムに関しても、アルゴリズムがもつ数値特性のいくつかを明らかにした。, 20740064
    研究期間 2008年 - 2010年
  • 計算科学の基盤となる超大規模線形方程式の高速解法の総合的研究と計算サーバの開発
    張 紹良; 山本 有作; 曽我部 知広; 阿部 邦美
    日本学術振興会, 科学研究費助成事業, 名古屋大学, 基盤研究(C), 超大規模線形方程式のためのクリロフ部分空間法の研究は盛んに行われており,その一部の成果を活用したライブラリーも多数開発され実際問題に役立っている.しかし,研究成果の多くは特定な解法,限定されている問題に対して得られたもので,多方面からの総合的な研究は決して多いと言えない.本研究班は,超大規模線形方程式の数理的諸問題を研究し,そのための高速解法に対して総合的開発を行った., 19560065
    研究期間 2007年 - 2010年
  • 情報爆発時代のロバストな自動チューニングシステムに向けた数理的基盤技術の研究
    須田 礼仁; 竹村 彰通; 室田 一雄; 山本 有作; 直野 健; 今村 俊幸
    日本学術振興会, 科学研究費助成事業, 東京大学, 特定領域研究, 情報爆発時代のソフトウェアは, 質・量とも爆発的に大きくなる情報を有効に活用するため, それとおなじくらい爆発的に拡大する計算・通信・記憶資源の多様性に, 柔軟かつロバストに適応する能力を備えなければならない. このような適応能力(以下総じて「自動チューニング機能」と呼ぶ)は, 一般に情報収集→推定→最適化→実行制御という流れで実現される. 本研究では上記の流れの4つの部分のうち, 計算環境や応用分野への依存が少なく, 数理の世界で表現できる推定と最適化の部分に焦点を当て, 自動チューニングの数理の普遍的構造を明らかにし, 情報爆発時代の資源とデータに柔軟かつ確実に適応するシステムを実現するために必要となるロバストな自動チューニング機構の数理的基盤を構築することを目的とする. 平成20年度は2つのサブテーマについて特に注力して研究を推進した. 「オンライン自動チューニングのための逐次実験計画」では,一般のBayesモデルにおいて性能を適切に学習できなくなる場合があることを指摘し, そのような事態を確実に回避できるようなBayesモデルの定式化を行った. また, そのようなBayesモデルを具体的に示すことにより, 確実に性能を学習して, 最適解に近づいてゆける手法を確立した. また, 「未知の組み合わせにおける性能の推定」では, 連立一次方程式の反復解法ライブラリであるLisをターゲットとして, 部分的な実験データから未測定のパラメタの組み合わせにおける収束・発散および所要時間を予測することを試みた. その結果, パラメタ探索を効率化する複数の手法が得られた. これらの手法は, 実験および最適化の目的関数によって使い分けるものである. このほか, 自動チューニングとその周辺のさまざまな研究課題に取り組み, また, 3年連続で国際ワークショップを主催し, 自動チューニング研究を世界的にけん引した., 19024018
    研究期間 2007年 - 2008年
  • 高速多重極子展開法に基づく価格評価法の高度/非金融デリバティブへの拡張の研究
    山本 有作
    日本学術振興会, 科学研究費助成事業, 名古屋大学, 基盤研究(C), 本課題では,非金融デリバティブ,および新しい資産価格モデルに基づく金融デリバティブに対し,高速・高精度な価格計算手法を開発することを目的として研究を行った。その結果,次の成果を得た。 (1)Dischelモデルと呼ばれる標準的な気温モデルに基づく天候デリバティブに対し,従来のモンテカルロ法に比べて10倍程度高速な新しい価格評価手法を開発した。 (2)ジャンプ拡散モデルに基づく金融デリバティブに対し,高速多重極子展開法に基づく価格評価手法が適用できることを明らかにした。 (3)オプション価格評価で用いられる連立線形常微分方程式に対し,行列の指数関数に基づく高速・高精度な数値解法を提案した。, 18560058
    研究期間 2006年 - 2008年
  • 大容量分散コンピューティングのための大規模スケーラブルP2Pグリッド基盤の研究
    佐藤 三久; 朴 泰祐; 建部 修見; 天笠 俊之; 櫻井 鉄也; 山本 有作; 高橋 大介; 北川 博之
    日本学術振興会, 科学研究費助成事業, 筑波大学, 基盤研究(A), P2Pグリッドとは、従来、各研究組織にある計算資源を共有することが目的であったグリッド技術を、P2P技術を活用しオフィスおよび個人のPCなどの潜在的な計算資源をグリッドの計算資源として活用するものである。本研究の目的は、期待される大量の計算資源による大容量コンピューティングのためのP2Pグリッド基盤を構築・利用する技術を確立し、その有効性を検証することである。 1. P2P環境の潜在的な計算資源をグリッドの計算資源として活用するために、多くのPCで利用されているWindowsにおいてLinuxバイナリを実行するためのシステムBEEとUDPによるファイアウォール越えを用いたP2Pオーバーレイネットワークを開発した。さらに、P2P環境における認証機構として、匿名相互証明書とP2P通信を用いる認証方式AUBReX、他のジョブスケジューラと相互に協調し資源を共有する機構について開発した。 2. 大容量コンピューティングのプログラミングモデルとして、RPCモデルから広域ネットワーク上の大容量データを効率的に扱うためのデータレイヤOmniStorageを開発し、それを拡張し、多数のノードに分散配置された大量データに対して、グローバルなデータ並列操作を行うプログラミング環境を提案した。また、大規模スケーラブルP2PにおけるXMLデータ管理について、MLデータの内容による検索に着目し,P2Pネットワーク上でXMLデータのキーワード検索を可能にする手法を考案した。 3. P2Pグリッド向きのアルゴリズムとして、複素積分を用いた非線形固有値計算アルゴリズムや前処理手法を開発した。また、P2Pグリッドの有望な高性能な計算資源として、ヘテロジーニアスマルチコアであるCellプロセッサを取り上げ、この資源を利用するための数値計算ソフトウエアを実装した。, 17200002
    研究期間 2005年 - 2007年
  • 情報爆発時代のロバストな自動チューニングソフトウェアに向けた数理的基盤技術の研究
    須田 礼仁; 竹村 彰通; 室田 一雄; 山本 有作; 直野 健; 片桐 孝洋
    日本学術振興会, 科学研究費助成事業, 東京大学, 特定領域研究, 情報爆発時代のソフトウェアは,質・量とも爆発的に大きくなる情報を技術と社会に活かすため,同様に爆発的に拡大する計算・通信・記憶資源の多様性に適応する能力(自動チューニング機能)を備えなければならない.我々は柔軟かつロバストな自動チューニング機能を有するソフトウェア開発するための数理的基盤技術の開拓を日指して以下の研究を行った. 1.実行時自動チューニングのための最適実験計画では,ベイズ統計に基づく最適解を大規模な数値計算により求め,優れた性質を持つことを示した. 2.計算機性能のためのモデルとして,キャッシュあふれやライン衝突などを考慮した性能モデルを構築した.また,AICによるモデル選択が一定の有効性を示すことを確認した. 3.分割表の検定に用いるMCMCの基底の研究を展開した.これは,従来困難であった多様な統計的解析を効率的に実現するものである. 4.M凸関数の概念をジャンプシステム上に拡張し,離散凸解析の研究をさらに展開した.これにより,マトロイド,デルタマトロイド,基多面体での知見を一般化した. 5.固有値解法であるマルチシフトQR法の性能モデルを構築し自動チューニングへの見通しをつけた.また,対称行列の三重対角化の手法について,その優劣がシステムや問題によりどのように変化するかについて系統的に調査した. 6.行列計算に関する自動チューニングのサーベイを行い,その動向を明らかにし,既存研究で残された課題を明らかにした. 7.分散メモリ並列計算における集団通信について,網羅的なアルゴリズム列挙法を開発した.特に本年度は2のべき以外のマシン数に適応した. 8.固有値問題の解法のうち,多固有値多分法について,実行時自動チューニングの手法を開発した.この結果は次期LAPACKに収納される予定である. このように,我々が目指す数理基盤の基礎をなす重要な研究成果が得られた., 18049014
    研究期間 2006年 - 2006年
  • 高速多重極子展開法を用いた派生証券の高速価格計算手法に関する研究
    山本 有作
    日本学術振興会, 科学研究費助成事業, 名古屋大学, 若手研究(B), 本研究では,アメリカン・オプション,経路依存型オプション,複数資産に依存するオプションなど,価格を求める解析的公式が存在しない複雑な派生証券について,高速・高精度に価格を計算するための数値計算手法の開発を目的とする。これに対して,平成17年度は次のような研究成果が得られた。 (1)アメリカン・ルックバック・オプションに対する価格計算法の開発 ルックバック・オプションのうち,期限前行使が可能ないわゆるアメリカン・ルックバック・オプションは実用上重要である。本研究では,高速ガウス変換と2重指数型数値積分公式の組み合わせによるルックバック・オプションの価格計算法をこの場合に拡張した。数値実験の結果,従来法で最速とされるReinerの方法と比べても,より高速・高精度に価格を計算できることを確認した。本成果は論文誌Publ.RIMS Kyoto Univ.で報告した。 (2)天候デリバティブに対する価格計算法の並列化 高速ガウス変換に基づく天候デリバティブの価格計算法を前年度に開発したが,この方法は従来のモンテカルロ法に比べて高速ではあるものの,リアルタイム・プライシングなどの応用にとってはまだ計算時間がかかり過ぎるという問題点があった。そこで,この方法に対する効率的な並列化手法を開発した。並列化の結果,10台程度のPCクラスタを用いれば典型的な天候デリバティブの価格計算を10秒程度で行えることを示した。この速度は,ほとんどの応用にとって十分である。本成果はSpringer-VerlagのLecture Notes in Computer Scienceで報告した。, 16760053
    研究期間 2004年 - 2005年