検索詳細｜電気通信大学

三輪　忍

情報・ネットワーク工学専攻	准教授
Ⅰ類（情報系）	准教授

研究者情報

対象リソース

外部リンク：http://www.hpc.is.uec.ac.jp/miwa/index-jp.html

学位

博士（情報学）, 京都大学

Doctor of Informatics, Kyoto University

研究キーワード

高性能計算

並列処理

コンピュータアーキテクチャ

研究分野

情報通信, 高性能計算

情報通信, 計算機システム

経歴

2022年08月 - 現在
特定国立研究開発法人理化学研究所, 計算科学研究センター, 客員研究員

2016年04月 - 現在
電気通信大学, 大学院情報理工学研究科, 准教授

2023年04月 - 2024年03月
メリーランド州立大学, 訪問研究員, アメリカ合衆国

2023年03月 - 2024年03月
ジョージタウン大学, 訪問研究員, アメリカ合衆国

2017年04月 - 2018年03月
ローレンスリバモア国立研究所, 訪問研究員

2017年02月 - 2017年09月
東京大学, 大学院情報理工学系研究科, 客員研究員

2015年03月01日 - 2016年03月31日
電気通信大学, 大学院情報システム学研究科, 准教授

2011年04月01日 - 2015年02月28日
東京大学, 大学院情報理工学系研究科, 助教

2008年01月01日 - 2011年03月31日
東京農工大学, 大学院工学府, 特任助教

2005年04月01日 - 2007年12月31日
京都大学, 大学院法学研究科, 助手

学歴

2002年04月01日 - 2005年03月31日
京都大学, 情報学研究科, 通信情報システム専攻

2000年04月01日 - 2002年03月25日
京都大学, 情報学研究科, 通信情報システム専攻

1996年04月 - 2000年03月
京都大学, 工学部, 情報工学科

1996年03月01日
静岡県立磐田南高等学校

委員歴

2025年10月 - 現在
HPCアプリケーションのLLM活用によるコード生成WG委員, サイエンティフィックシステム研究会

2025年04月 - 現在
編集委員, 電子情報通信学会エレクトロニクスソサイエティ英文論文誌Special Issue on Solid-State Circuit Design

2025年05月
専門委員, 電子情報通信学会ICD研究会

2020年10月 - 2023年03月
審査委員, 科学研究費助成事業若手研究（高性能計算分野）, 政府

2020年 - 2021年03月
副編集委員長, 情報処理学会ACS論文誌編集委員会, 学協会

2015年 - 2019年
編集委員, 電子情報通信学会情報・システムソサイエティ英文論文誌編集委員会, 学協会

2014年 - 2017年
幹事, 情報処理学会計算機アーキテクチャ研究会, 学協会

2016年04月
NEDO評価委員, 政府

2015年 - 2016年
代表会員, 情報処理学会, 学協会

2014年 - 2015年
主査, 情報処理学会誌システムグループ編集委員会, 学協会

2011年 - 2015年
編集委員, 情報処理学会ACS論文誌編集委員会, 学協会

2013年 - 2014年
幹事, 情報処理学会誌システムグループ編集委員会, 学協会

2010年 - 2013年
編集委員, 情報処理学会誌ハードウェアグループ編集委員会, 学協会

2009年 - 2013年
編集委員, 情報処理学会論文誌編集委員会, 学協会

2011年 - 2011年
執筆委員, 電子情報通信学会「知識ベース」執筆委員会, 学協会

2010年 - 2010年
選定委員, 情報処理学会論文賞選定ワーキング・グループ, 学協会

2009年 - 2009年
選定委員, 情報処理学会論文賞選定ワーキング・グループ, 学協会

研究活動情報

受賞

受賞日 2025年06月
Analysis of MPI Parallel Code Generated by GPT-4o
Best Paper Award in LLM4HPC, R. Tanaka;H. Yamaki;S. Miwa;H. Honda
共同研究・競争的資金等URL

受賞日 2019年
Functionally-Predefined Kernel: a Way to Reduce CNN Computation
Best paper award for computers track in the 2019 IEEE PacRim, Y. Inouchi, H. Yamaki, S. Miwa, and T. Tsumura
国際学会・会議・シンポジウム等の賞

受賞日 2010年
Dalvik アクセラレータ：Android 端末における Java アプリケーションの高速実行機構
組込みシステムシンポジウム2010 優秀論文賞, 太田淳,三輪忍,中條拓伯
国内学会・会議・シンポジウム等の賞

受賞日 2010年
Hilbert-Huang変換の並列化およびGPUによる高速化
GPUチャレンジ2010 自由課題部門第2位, Pulung Waskito,三輪忍,満倉靖恵,中條拓伯
国内学会・会議・シンポジウム等の賞

受賞日 2008年
FPGAにおけるマルチSMTプロセッサの実装
SACSIS2008最優秀ポスター賞, 小笠原嘉泰,館一平,三輪忍,中條拓伯
国内学会・会議・シンポジウム等の賞

受賞日 2003年
リカレントニューラルネットにおける移動ロボットのナビゲーション課題の学習
平成15年度情報処理学会関西支部支部大会学生奨励賞, 三輪忍
国内学会・会議・シンポジウム等の賞

論文

A comprehensive analysis of the impact of sub 10-nm CNFET technology on 64-bit parallel prefix adders and 32-bit matrix multiply units
Chenlin Shi; Tongxin Yang; Ryota Shioya; Hayato Yamaki; Hiroki Honda; Shinobu Miwa
Integration, Elsevier BV, 106巻, 掲載ページ 102583-102583, 出版日 2026年01月
研究論文（学術雑誌）
DOI URL

Analysis of MPI Parallel Code Generated by GPT-4o
Rin Tanaka; Hayato Yamaki; Shinobu Miwa; Hiroki Honda
ISC High Performance 2025 International Workshops, 出版日 2026年, 査読付
DOI URL

MPI-SGX: Enabling Confidential Computing for MPI Parallel Applications with Intel SGX Technology
K. Shimojima; H. Yamaki; H. Honda; S. Matsuo; A. Takefusa; S. Miwa
ラスト(シニア)オーサー, The International Conference for High Performance Computing, Networking, Storage and Analysis (SC25, poster presentation), 出版日 2025年11月, 査読付

Feedback-based Dynamic Traffic Balancing for Multipath Routing in ISP Networks
Sho SATO; Shinobu MIWA; Hiroki HONDA; Hayato YAMAKI
IEICE Transactions on Information and Systems, Institute of Electronics, Information and Communications Engineers (IEICE), 出版日 2025年
研究論文（学術雑誌）
URL
DOI URL

VAHRM: Variation-Aware Resource Management in Heterogeneous Supercomputing Systems
Kohei Yoshida; Ryuichi Sakamoto; Kento Sato; Abhinav Bhatele; Hayato Yamaki; Hiroki Honda; Shinobu Miwa
IEEE Transactions on Parallel and Distributed Systems, 出版日 2025年
研究論文（学術雑誌）
DOI URL

CACTI-CNFET: an Analytical Tool for Timing, Power, and Area of SRAMs with Carbon Nanotube Field Effect Transistors.
Shinobu Miwa; Eiichiro Sekikawa; Tongxin Yang; Ryota Shioya; Hayato Yamaki; Hiroki Honda
ASP-DAC, 掲載ページ 1350-1356, 出版日 2025年
研究論文（国際会議プロシーディングス）
URL
URL 2
DOI URL

Evaluating MPI Performance on SGX and Gramine
K. Shimojima; S. Miwa; H. Yamaki; H. Honda
2024 IEEE International Conference on Cluster Computing (CLUSTER) (poster presentation), 出版日 2024年09月

Post-Route Power Estimation: a Case Study of RIKEN-CGRA
C. Shi; B. Adhi; S. Miwa; K. Sano
2024 IEEE International Conference on Cluster Computing (CLUSTER) (poster presentation), 出版日 2024年09月, 査読付

Power-Efficiency Variation on A64FX Supercomputers and its Application to System Operation
T. Kusaba; Y. Awaki; K. Yoshida; S. Miwa; H. Yamaki; T. Hanawa; H. Honda
2024 IEEE International Conference on Cluster Computing Workshop (CLUSTER Workshop), 出版日 2024年09月, 査読付

Analyzing the impact of CUDA versions on GPU applications
Kohei Yoshida; Shinobu Miwa; Hayato Yamaki; Hiroki Honda
Parallel Computing, Elsevier BV, 120巻, 掲載ページ 103081-103081, 出版日 2024年06月, 査読付
研究論文（学術雑誌）
DOI URL

CNFET-OCL: Open-Source Cell Libraries for Advanced CNFET Technologies.
Chenlin Shi; Shinobu Miwa; Tongxin Yang; Ryota Shioya; Hayato Yamaki; Hiroki Honda
IEEE Access, 12巻, 掲載ページ 165335-165347, 出版日 2024年
研究論文（学術雑誌）
URL
DOI URL

Analyzing the Performance Impact of HPC Workloads with Gramine+SGX on 3rd Generation Xeon Scalable Processors
Shinobu Miwa; Shin'Ichiro Matsuo
筆頭著者, Proceedings of the SC '23 Workshops of The International Conference on High Performance Computing, Network, Storage, and Analysis, ACM, 掲載ページ 1850-1858, 出版日 2023年11月12日, 査読付
研究論文（国際会議プロシーディングス）
URL
DOI URL

CNFET7
Chenlin Shi; Shinobu Miwa; Tongxin Yang; Ryota Shioya; Hayato Yamaki; Hiroki Honda
Proceedings of the 28th Asia and South Pacific Design Automation Conference, ACM, 掲載ページ 763-768, 出版日 2023年01月16日
研究論文（国際会議プロシーディングス）
URL
DOI URL

CNFET7: An Open Source Cell Library for 7-nm CNFET Technology
C. Shi; S. Miwa; T. Yang; R. Shioya; H. Yamaki; H. Honda
The 28th Asia and South Pacific Design Automation Conference (ASP-DAC), 掲載ページ 763-768, 出版日 2023年01月, 査読付
研究論文（国際会議プロシーディングス）, 英語

Analyzing Performance and Power-Efficiency Variations among NVIDIA GPUs
K. Yoshida; R. Sageyama; S. Miwa; H. Yamaki; H. Honda
The 51st International Conference on Parallel Processing (ICPP), 65号, 掲載ページ 1-12, 出版日 2022年11月, 査読付
研究論文（国際会議プロシーディングス）, 英語

PredCom: A Predictive Approach to Collecting Approximated Communication Traces
Shinobu Miwa; Ignacio Laguna; Martin Schulz
IEEE Transactions on Parallel and Distributed Systems, Institute of Electrical and Electronics Engineers ({IEEE}), 32巻, 1号, 掲載ページ 45-58, 出版日 2021年01月01日, 査読付
研究論文（学術雑誌）, 英語
DOI URL

Footprint-Based DIMM Hotplug
Shinobu Miwa; Masaya Ishihara; Hayato Yamaki; Hiroki Honda; Martin Schulz
IEEE Transactions on Computers, Institute of Electrical and Electronics Engineers ({IEEE}), 69巻, 2号, 掲載ページ 172-184, 出版日 2020年02月01日, 査読付
研究論文（学術雑誌）, 英語
DOI URL

RPC: An Approach for Reducing Compulsory Misses in Packet Processing Cache.
Hayato Yamaki; Hiroaki Nishi; Shinobu Miwa; Hiroki Honda
IEICE Trans. Inf. Syst., 103-D巻, 12号, 掲載ページ 2590-2599, 出版日 2020年
研究論文（学術雑誌）
URL
URL 2
DOI URL

Evaluating Architecture-Level Optimization in Packet Processing Caches
K. Tanaka; H. Yamaki; S. Miwa; H. Honda
Computer Networks, Elsevier, 181巻, 107550号, 掲載ページ 1-10, 出版日 2020年, 査読付
研究論文（学術雑誌）, 英語

Multi-Level Packet Processing Caches
K. Tanaka; H. Yamaki; S. Miwa; H. Honda
The 2019 IEEE Symposium on Low-Power and High-Speed Chips and Systems (COOL Chips 22), 掲載ページ 1-3, 出版日 2019年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Functionally-Predefined Kernel: a Way to Reduce CNN Computation
Y. Inouchi; H. Yamaki; S. Miwa; T. Tsumura
The 2019 IEEE Pacific Rim Conference on Communications, Computers and Signal Processing (PacRim 2019), 掲載ページ 1-6, 出版日 2019年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Evaluating the Impact of Energy Efficient Networks on HPC Workloads
G. Georgakoudis; N. Jain; T. Ono; K. Inoue; S. Miwa; A. Bhatele
26th IEEE International Conference on High Performance Computing, Data, and Analytics (HiPC), IEEE, (to appear)巻, 掲載ページ 1-10, 出版日 2019年, 査読付
研究論文（国際会議プロシーディングス）, 英語
URL
DOI URL

Power management framework for post-petascale supercomputers
Masaaki Kondo; Ikuo Miyoshi; Koji Inoue; Shinobu Miwa
Advanced Software Technologies for Post-Peta Scale Computing: The Japanese Post-Peta CREST Research Project, Springer Singapore, 掲載ページ 249-269, 出版日 2018年12月06日
論文集(書籍)内論文, 英語
DOI URL

Run-Time DFS/DCT Optimization for Power-Constrained HPC Systems
I. Miyoshi; S. Miwa; K. Inoue; M. Kondo
The International Conference on High Performance Computing in Asia-Pacific Region, poster巻, 出版日 2018年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Data Prediction for Response Flows in Packet Processing Cache
H. Yamaki; H. Nishi; S. Miwa; H. Honda
2018 55th ACM/EDAC/IEEE Design Automation Conference, ACM, 110号, 掲載ページ 110-6, 出版日 2018年, 査読付
研究論文（国際会議プロシーディングス）, 英語
URL
URL 2
DOI URL
DOI 2 URL

Optimizing Memory Hierarchy within an Internet Router for High-Throughput and Energy-Efficient Packet Processing
K. Tanaka; H. Yamaki; S. Miwa; H. Honda
ACM Student Research Competition (in conjunction with the 51st Annual ACM/IEEE International Symposium on Microarchitecture) (poster presentation), poster巻, 出版日 2018年, 査読付
研究論文（国際会議プロシーディングス）, 英語

A Runtime Optimization Selection Framework to Realize Energy Efficient Networks-on-Chip.
Yuan He; Masaaki Kondo; Takashi Nakada; Hiroshi Sasaki; Shinobu Miwa; Hiroshi Nakamura
IEICE Transactions, 一般社団法人電子情報通信学会, 99-D巻, 12号, 掲載ページ 2881-2890, 出版日 2016年, 査読付,
Networks-on-Chip (or NoCs, for short) play important roles in modern and future multi-core processors as they are highly related to both performance and power consumption of the entire chip. Up to date, many optimization techniques have been developed to improve NoC's bandwidth, latency and power consumption. But a clear answer to how energy efficiency is affected with these optimization techniques is yet to be found since each of these optimization techniques comes with its own benefits and overheads while there are also too many of them. Thus, here comes the problem of when and how such optimization techniques should be applied. In order to solve this problem, we build a runtime framework to throttle these optimization techniques based on concise performance and energy models. With the help of this framework, we can successfully establish adaptive selections over multiple optimization techniques to further improve performance or energy efficiency of the network at runtime.

英語
URL
URL 2
DOI URL

Initial Study of Reconfigurable Neural Network Accelerators
Momoka Ohba; Satoshi Shindo; Shinobu Miwa; Tomoaki Tsumura; Hayato Yamaki; Hiroki Honda
2016 FOURTH INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), poster巻, 掲載ページ 707-709, 出版日 2016年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Evaluation of Task Mapping on Multicore Neural Network Accelerators
Satoshi Shindo; Momoka Ohba; Tomoaki Tsumura; Shinobu Miwa
2016 FOURTH INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), 掲載ページ 415-421, 出版日 2016年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Subarray Level Power-Gating in STT-MRAM Caches to Mitigate Energy Impact of Peripheral Circuits
E. Arima; S. Miwa; T. Nakada; S. Takeda; H. Noguchi; S. Fujita; H. Nakamura
2015 52nd ACM/EDAC/IEEE Design Automation Conference, poster巻, 出版日 2015年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Runtime Multi-Optimizations for Energy Efficient On-chip Interconnections
Yuan He; Masaaki Kondo; Takashi Nakada; Hiroshi Sasaki; Shinobu Miwa; Hiroshi Nakamura
2015 33RD IEEE INTERNATIONAL CONFERENCE ON COMPUTER DESIGN (ICCD), 掲載ページ 455-458, 出版日 2015年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Immediate Sleep: Reducing Energy Impact of Peripheral Circuits in STT-MRAM Caches
Eishi Arima; Hiroki Noguchi; Takashi Nakada; Shinobu Miwa; Susumu Takeda; Shinobu Fujita; Hiroshi Nakamura
2015 33RD IEEE INTERNATIONAL CONFERENCE ON COMPUTER DESIGN (ICCD), 掲載ページ 149-156, 出版日 2015年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Memory Hotplug for Energy Savings of HPC systems
S. Miwa; H. Honda
The International Conference for High Performance Computing, Networking, Storage and Analysis, poster巻, 出版日 2015年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Profile-Based Power Shifting in Interconnection Networks with On/Off Links
Shinobu Miwa; Hiroshi Nakamura
PROCEEDINGS OF SC15: THE INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS, 掲載ページ 37:1-37:11, 出版日 2015年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Low-power cache memory with state-of-the-art STT-MRAM for high-performance processors
Susumu Takeda; Hiroki Noguchi; Kumiko Nomura; Shinobu Fujita; Shinobu Miwa; Eishi Arima; Takashi Nakada; Hiroshi Nakamura
2015 INTERNATIONAL SOC DESIGN CONFERENCE (ISOCC), 掲載ページ 153-154, 出版日 2015年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Area-Efficient Microarchitecture for Reinforcement of Turbo Mode
Shinobu Miwa; Takara Inoue; Hiroshi Nakamura
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E97D巻, 5号, 掲載ページ 1196-1210, 出版日 2014年05月, 査読付
研究論文（学術雑誌）, 英語
DOI URL

Performance estimation of high performance computing systems with Energy Efficient Ethernet technology.
Shinobu Miwa; Sho Aita; Hiroshi Nakamura
Computer Science - R&D, 29巻, 3-4号, 掲載ページ 161-169, 出版日 2014年, 査読付
URL
DOI URL

実HPC環境におけるEEEの電力/性能評価
三輪忍; 會田翔; 安島雄一郎; 清水俊幸; 安里彰; 中村宏
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 7巻, 4号, 掲載ページ 67-83, 出版日 2014年, 査読付
日本語

Evaluation of Core Hopping on POWER7
Shinobu Miwa; Charles R. Lefurgy
ACM SIGMETRICS Performance Evaluation Review, ACM, special issue巻, greenmetrics 2014号, 掲載ページ 11-16, 出版日 2014年, 査読付
研究論文（学術雑誌）, 英語

低CPU負荷を考慮したSTT-MRAMラスト・レベル・キャッシュの要求性能の解析
有間英志; 薦田登志矢; 中田尚; 三輪忍; 野口絃希; 野村久美子; 安部恵子; 藤田忍; 中村宏
電子情報通信学会論文誌, J97-A巻, 10号, 掲載ページ 629-647, 出版日 2014年, 査読付
日本語

Design Aid of Multi-core Embedded Systems with Energy Model
T. Nakada; K. Okamoto; T. Komoda; S. Miwa; Y. Sato; H. Ueki; M. Hayashikoshi; T. Shimizu; H. Nakamura
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 7巻, 3号, 掲載ページ 37-46, 出版日 2014年, 査読付
研究論文（学術雑誌）, 日本語

Data-aware Power Management for Periodic Real-time Systems with Non-Volatile Memory
Takashi Nakada; Takuya Shigematsu; Toshiya Komoda; Shinobu Miwa; Hiroshi Nakamura; Yohei Sato; Hiroshi Ueki; Masanori Hayashikoshi; Toru Shimizu
2014 IEEE NON-VOLATILE MEMORY SYSTEMS AND APPLICATIONS SYMPOSIUM (NVMSA), 掲載ページ 1-6, 出版日 2014年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Fine-Grain Power-Gating on STT-MRAM Peripheral Circuits with Locality-aware Access Control
E. Arima; T. Nakada; S. Miwa; S. Takeda; H. Noguchi; S. Fujita; H. Nakamura
The Memory Forum, 掲載ページ 1-5, 出版日 2014年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Normally-Off Computing Project : Challenges and Opportunities
Hiroshi Nakamura; Takashi Nakada; Shinobu Miwa
2014 19TH ASIA AND SOUTH PACIFIC DESIGN AUTOMATION CONFERENCE (ASP-DAC), special session 1S巻, 1号, 掲載ページ 1-5, 出版日 2014年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Power capping of CPU-GPU heterogeneous systems through coordinating DVFS and task mapping.
Toshiya Komoda; Shingo Hayashi; Takashi Nakada; Shinobu Miwa; Hiroshi Nakamura
2013 IEEE 31st International Conference on Computer Design, ICCD 2013, Asheville, NC, USA, October 6-9, 2013, IEEE Computer Society, 掲載ページ 349-356, 出版日 2013年, 査読付
URL
DOI URL

キャッシュ電源遮断時の性能ペナルティ削減のための損失データプリフェッチ
有間英志; 薦田登志矢; 中田尚; 三輪忍; 中村宏
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 6巻, 3号, 掲載ページ 118-130, 出版日 2013年, 査読付
研究論文（学術雑誌）, 日本語

Integrating Multi-GPU Execution in an OpenACC Compiler
Toshiya Komoda; Shinobu Miwa; Hiroshi Nakamura; Naoya Maruyama
2013 42ND ANNUAL INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING (ICPP), 掲載ページ 260-269, 出版日 2013年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Performance Modeling for Designing NoC-based Multiprocessors
Takashi Nakada; Shinobu Miwa; Keisuke Yano; Hiroshi Nakamura
RAPID SYSTEM PROTOTYPING: SHORTENING THE PATH FROM SPECIFICATION TO PROTOTYPE (RSP 2013), 掲載ページ 30-36, 出版日 2013年, 査読付
研究論文（国際会議プロシーディングス）, 英語

McRouter: Multicast within a Router for High Performance Network-on-Chips
Yuan He; Hiroshi Sasaki; Shinobu Miwa; Hiroshi Nakamura
2013 22ND INTERNATIONAL CONFERENCE ON PARALLEL ARCHITECTURES AND COMPILATION TECHNIQUES (PACT), 掲載ページ 319-329, 出版日 2013年, 査読付
研究論文（国際会議プロシーディングス）, 英語

D-MRAM Cache: Enhancing Energy Efficiency with 3T-1MTJ DRAM / MRAM Hybrid Memory
Hiroki Noguchi; Kumiko Nomura; Keiko Abe; Shinobu Fujita; Eishi Arima; Kyundong Kim; Takashi Nakada; Shinobu Miwa; Hiroshi Nakamura
DESIGN, AUTOMATION & TEST IN EUROPE, 掲載ページ 1813-1818, 出版日 2013年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Predict-more router: A low latency NoC router with more route predictions
Yuan He; Hiroshi Sasaki; Shinobu Miwa; Hiroshi Nakamura
Proceedings - IEEE 27th International Parallel and Distributed Processing Symposium Workshops and PhD Forum, IPDPSW 2013, IEEE Computer Society, 掲載ページ 842-850, 出版日 2013年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Evaluation of a New Power-Gating Scheme Utilizing Data Retentiveness on Caches
Kyundong Kim; Seidai Takeda; Shinobu Miwa; Hiroshi Nakamura
IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E95A巻, 12号, 掲載ページ 2301-2308, 出版日 2012年12月, 査読付
研究論文（学術雑誌）, 英語
DOI URL

Communication Library to Overlap Computation and Communication for OpenCL Application.
Toshiya Komoda; Shinobu Miwa; Hiroshi Nakamura
26th IEEE International Parallel and Distributed Processing Symposium Workshops & PhD Forum, IPDPS 2012, Shanghai, China, May 21-25, 2012, IEEE Computer Society, 掲載ページ 567-573, 出版日 2012年, 査読付
URL
URL 2
DOI URL

Stepwise sleep depth control for run-time leakage power saving
Seidai Takeda; Shinobu Miwa; Kimiyoshi Usami; Hiroshi Nakamura
Proceedings of the ACM Great Lakes Symposium on VLSI, GLSVLSI, 掲載ページ 233-238, 出版日 2012年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Efficient Leakage Power Saving by Sleep Depth Controlling for Multi-mode Power Gating
Seidai Takeda; Shinobu Miwa; Kimiyoshi Usami; Hiroshi Nakamura
2012 13TH INTERNATIONAL SYMPOSIUM ON QUALITY ELECTRONIC DESIGN (ISQED), 掲載ページ 625-632, 出版日 2012年, 査読付
研究論文（国際会議プロシーディングス）, 英語

A novel power-gating scheme utilizing data retentiveness on caches
Kyundong Kim; Seidai Takeda; Shinobu Miwa; Hiroshi Nakamura
Proceedings of the ACM Great Lakes Symposium on VLSI, GLSVLSI, 掲載ページ 91-94, 出版日 2012年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Evaluation of GPU-Based Empirical Mode Decomposition for Off-Line Analysis
Pulung Waskito; Shinobu Miwa; Yasue Mitsukura; Hironori Nakajo
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E94D巻, 12号, 掲載ページ 2328-2337, 出版日 2011年12月, 査読付
研究論文（学術雑誌）, 英語
DOI URL

A Fine-Grained Runtime Power/Performance Optimization Method for Processors with Adaptive Pipeline Depth
Jun Yao; Shinobu Miwa; Hajime Shimada; Shinji Tomita
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 26巻, 2号, 掲載ページ 292-301, 出版日 2011年03月, 査読付
研究論文（学術雑誌）, 英語
DOI URL

Android端末におけるハードウェアによるJavaの高速化手法の提案
太田淳; 三輪忍; 中條拓伯
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 42巻, 3号, 掲載ページ 115-132, 出版日 2011年, 査読付
研究論文（学術雑誌）, 日本語

Dalvik アクセラレータ：Android 端末における Java アプリケーションの高速実行機構
太田淳; 三輪忍; 中條拓伯
組込みシステムシンポジウム (ESS2010), 2010巻, 10号, 掲載ページ 13-22, 出版日 2010年10月, 査読付
日本語

Accelerating Hilbert-Huang Transform using GPU
Pulung Waskito; Shinobu Miwa; Yasue Mitsukura; Hironori Nakajo
情報処理学会ハイパフォーマンスコンピューテング研究会報告, 2010-HPC-126巻, No.3号, 掲載ページ 1-8, 出版日 2010年08月
研究論文（学術雑誌）, 英語

選択的キャッシュ・アロケーション：マルチスレッド環境におけるキャッシュ利用効率の向上手法
堀部悠平; 三輪忍; 塩谷亮太; 五島正裕; 中條拓伯
情報処理学会計算機アーキテクチャ研究会報告, 2010-ARC-190巻, No.1号, 掲載ページ 1-8, 出版日 2010年08月
研究論文（大学，研究機関等紀要）, 日本語

Hilbert-Huang変換の並列化およびGPUによる高速化
Pulung Waskito; 三輪忍; 満倉靖恵; 中條拓伯
先進的計算基盤システムシンポジウム (SACSIS2010) ポスター・セッション, Vol.2010巻, No.5号, 掲載ページ 139-140, 出版日 2010年05月, 査読付
日本語

選択的キャッシュ・ライン・アロケーションによるキャッシュの容量効率向上
堀部悠平; 三輪忍; 塩谷亮太; 五島正裕; 中條拓伯
先進的計算基盤システムシンポジウム(SACSIS2010) ポスター・セッション, Vol.2010巻, No.5号, 掲載ページ 121-122, 出版日 2010年05月, 査読付
研究論文（学術雑誌）, 日本語

DalvikアクセラレータのためのMIPSシミュレータを用いた評価環境
太田淳; 茂手木貴彦; 三輪忍; 中條拓伯
先進的計算基盤システムシンポジウム (SACSIS2010) ポスター・セッション, Vol.2010巻, No.5号, 掲載ページ 113-114, 出版日 2010年05月, 査読付
日本語

小容量 CAM を用いたレジスタ・マップ表の回路面積削減
三輪忍; 張鵬; 横山弘基; 堀部悠平; 中條拓伯
先進的計算基盤システムシンポジウム (SACSIS2010)論文集, Vol.2010巻, No.5号, 掲載ページ 329-338, 出版日 2010年05月, 査読付
日本語

キャッシュを用いたレジスタ・マップ表の回路面積削減
三輪忍; 張鵬; 横山弘基; 堀部悠平; 中條拓伯
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 3巻, 3号, 掲載ページ 44-55, 出版日 2010年, 査読付, SMTの普及により，近年，レジスタ・マップ表は肥大化する傾向にある．マップ表は，通常，マルチポートRAMで構成される．同じくマルチポートRAMであるレジスタ・ファイルに対しては，小容量のキャッシュを用いて回路面積を削減する手法が提案されているが，この手法をマップ表に適用した例はまだない．また，この手法は，マルチポートRAMの回路面積を削減する一般的な手法，たとえばマルチバンク化などとの比較がまったく行われていなかった．そこで今回，小容量のキャッシュを用いる手法をマップ表に適用し，マルチバンク化した場合との比較を行った．本稿ではその結果を報告する．Area of register map tables is growing up in recent processors following the spread of SMT technologies. Register map tables are usually implemented with multi-port RAMs as well as register files. In order to reduce area of register files, a technique which uses a small cache has been proposed, but it has never been applied to register map tables. Moreover, the technique has never been compared with other techniques which aim to reduce area of multi-port RAM. This paper shows the result when both techniques are applied to register map tables.
研究論文（学術雑誌）, 日本語
URL
URL 2

An Effective Replacement Policy Focusing on Lifetime of a Cache Line
H. Yokoyama; Y. Horibe; P. Zhang; S. Miwa; H. Nakajo
International Conference on Computer Design, 掲載ページ 146-152, 出版日 2010年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Parallelizing Hilbert-Huang transform on a GPU
Pulung Waskito; Shinobu Miwa; Yasue Mitsukura; Hironori Nakajo
Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 掲載ページ 184-190, 出版日 2010年, 査読付
研究論文（国際会議プロシーディングス）, 英語
DOI URL

Extraction of horns in a noisy environment by EMD
M. Nakanishi; Y. Mitsukura; T. Tanaka; S. Miwa; H. Nakajo
International Workshop on Nonlinear Circuits and Signal Processing, IIC-10巻, 71.73-78号, 掲載ページ 333-336, 出版日 2010年, 査読付
英語

SMTプロセッサにおけるL1/L2キャッシュアクセス動的切替方式
小笠原嘉泰; 三輪忍; 中條拓伯
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 2巻, 3号, 掲載ページ 12-25, 出版日 2009年, 査読付, SMTプロセッサは，複数のスレッドで演算器やキャッシュメモリを共有し，性能向上を目指している．ところが，キャッシュメモリの共有が原因で，キャッシュラインにおけるスレッド間競合が発生し，性能が低下するという問題がある．そこで本論文では，キャッシュアクセスとしてL2-ダイレクトアクセスを可能にし，それを適切な条件で適用することでL1-キャッシュメモリを使用するスレッド数を調節し，スレッド間競合を抑える．L1/L2キャッシュアクセスの動的切替え方式として，ヒット率を切替えパラメータとする方式とセットごとにキャッシュアクセスを切り替える方式を提案し，設計した．評価の結果，提案方式は通常のキャッシュアクセスと比較し，最大1.106倍，平均1.022倍の性能向上をもたらした．また，各提案方式を実装した結果，どちらの方式も，プロセッサとキャッシュメモリを含んだチップ全体で3%未満とわずかなハードウェア増加量で実現できることを示した．An SMT processor aims to gain higher performance by sharing resources such as ALUs and cache memory among several threads. However, sharing cache memory causes thread conflict miss which degrades its performance. This paper proposes two dynamic switching strategies of accessing L1/L2 cache in order to improve performance. One uses the number of cache miss as switching, and the other switches accessing algorithm in each set. Dynamic switching strategies adjust number of thread in L1 Cache memory in order to reduce thread conflict miss. As a result, dynamic switching strategies show 1.022 times as high performance in average and 1.106 times in max as a conventional cache access. Furthermore, both dynamic switching strategies can be implemented with small additional hardware cost in less than 3%.
研究論文（学術雑誌）, 日本語
URL
URL 2

An Instruction Scheduler for Dynamic ALU Cascading Adoption
J. Yao; K. Ogata; H. Shimada; S. Miwa; H. Nakashima; S. Tomita
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 2巻, 2号, 掲載ページ 30-47, 出版日 2009年, 査読付, To reduce the processor energy consumption under low workload and low clock frequency executions, a possible solution is to use ALU cascading while keeping the supply voltage unchanged. This cascading scheme uses a single cycle to execute multiple ALU instructions which have a data dependence relationship between them and thus saves clock cycles for the whole execution. Since the processor energy consumption is the product result of both power and execution time, ALU cascading is expected to help energy optimization for microprocessors operating under low frequency status. To implement ALU cascading in a current superscalar processor, a specific instruction scheduler is required to wakeup a pair of cascadable instructions simultaneously despite there being a data dependence relationship between them. Furthermore, ALU cascading is only applied under low clock frequency execution mode so that the instruction scheduler must support standard scheduling for the normal clock frequency execution. In this paper, we propose an instruction scheduling method that enables the additional wakeup features for the utilization of ALU cascading without large hardware extensions. With this scheduler, the average IPC improvement becomes 3.7% in SPECint2000 and 6.4% in Mediabench, as compared to the baseline execution. The delay of additional hardware required for the ALU cascading purpose is also evaluated to study the complexity of ALU cascading.
研究論文（学術雑誌）, 日本語
URL
DOI URL

Dynamic Switching Techniques of Accessing L1/L2 Cache on an SMT Processor
Y. Ogasawara; P. Waskito; S. Miwa; H. Nakajo
International Conference on Computer Design, 掲載ページ 171-177, 出版日 2009年, 査読付
研究論文（国際会議プロシーディングス）, 英語

Improving Effectiveness of Pipeline Stage Unification via ALU Cascading
J. Yao; H. Shimada; K. Ogata; S. Miwa; S. Tomita
12th IEEE Symposium on Low-Power and High-Speed Chips, 掲載ページ 423-436, 出版日 2009年, 査読付
研究論文（国際会議プロシーディングス）, 英語

分岐予測精度改善のための決定的な分岐フィルタ機構
三輪忍; 中條拓伯
情報処理学会計算機アーキテクチャ研究会報告(SWoPP 2008), 2008-ARC巻, 179号, 掲載ページ 61-66, 出版日 2008年08月
日本語

A dynamic control mechanism for pipeline stage unification by identifying program phases
Jun Yao; Shinobu Miwa; Ilajime Shimada; Shinji Tomita
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E91D巻, 4号, 掲載ページ 1010-1022, 出版日 2008年04月, 査読付
研究論文（学術雑誌）, 英語
DOI URL

Low-Complexity Bypass Network Using Small RAM
Shinobu Miwa; Hironori Ichibayashi; Hidetsugu Irie; Masahiro Goshima; Hironori Nakajo; Shinji Tomita
International Conference on Computer Design, 48巻, SIG13(ACS19)号, 掲載ページ 153-159, 出版日 2008年, 査読付
英語

Three quads: An interconnection network for interactive simulations
Tomoyuki Yoshimura; Keita Saito; Hajime Shimada; Shinobu Miwa; Yasuhiko Nakashima; Shin-ichiro Mori; Shinji Tomita
SYSTEMS MODELING AND SIMULATION: THEORY AND APPLICATIONS, ASIA SIMULATION CONFERENCE 2006, 掲載ページ 362-+, 出版日 2007年, 査読付
研究論文（国際会議プロシーディングス）, 英語

小容量RAMを用いたオペランド・バイパスの複雑さの軽減手法
三輪忍; 一林宏憲; 入江英嗣; 五島正裕; 富田眞治
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 48巻, SIG13号, 掲載ページ 58-69, 出版日 2007年, 査読付, 配線遅延の相対的な増大にともない、近年、長い配線を持つレジスタ・ファイルやオペランド・バイパスといったユニットがクリティカルになってきている。クリティカルなユニットをクリティカルでなくするためには、ユニットをパイプライン化することが有効である。ところが、レジスタ・ファイルのパイプライン化はオペランド・バイパスを複雑化する。オペランド・バイパスはそれ自体がすでにクリティカルであり、それをこれ以上複雑にするのは受け入れがたい。この問題に対し、レジスタ・キャッシュが提案されている。レジスタ・キャッシュは、レジスタ・ファイルの一部を保持する、1 サイクルでアクセス可能な小型のバッファである。レジスタ・キャッシュを持つプロセッサは、それにヒットすれば、1 サイクルでレジスタにアクセスできる。そのため、そのようなプロセッサのオペランド・バイパスは、1 サイクルのレジスタ・ファイルを持つプロセッサのそれと同等で済む。しかし、レジスタ・キャッシュはミス・ペナルティが大きく、それを採用したプロセッサの性能は悪化してしまう。そこで我々は、レジスタ・キャッシュとほぼ同じ回路構成ながらミス・ペナルティをなくした、バイパス・バッファを提案する。本稿では、提案手法と理想化されたレジスタ・キャッシュとを比較し、提案手法を採用したプロセッサの方が高性能であることを示す。For the wire delay problem, the units with the long wires become critical such as register files and a bypass network. To prevent the units to be critical, the pipelining is an effective technique. However, the pipelining of register files complicates a bypass network. It is unacceptable that a bypass network is complicated because it is already critical. A register cache is proposed to resolve this problem. The register cache is a small buffer to cache register files. It is accessible in 1 cycle. If the instruction hits the register cache, the processor with the register cache behaves same as the processor with the non-pipelined register files. Therefore, the bypass network of the former processor is same as that of the latter processor. However, the processor with the register cache doesn't outperform because of the much register cache miss penalty. Then, we propose a bypass buffer. There is no miss penalty on the processor with it because it is not a cache. In this paper, we show that the processor with the bypass buffer achieves high performance rather than the processor with the ideal register cache.
研究論文（学術雑誌）, 日本語
URL
URL 2

Optimal Pipeline Depth with Pipeline Stage Unification Adoption
J. Yao; S. Miwa; H. Shimada; S. Tomita
ACM SIGARCH Computer Architecture News, ACM, 35巻, 5号, 掲載ページ 3-6, 出版日 2007年, 査読付
研究論文（学術雑誌）, 英語

パス情報を用いた分岐フィルタ機構
三輪忍; 福山智久; 嶋田創; 五島正裕; 中島康彦; 森眞一郎; 富田眞治
情報処理学会論文誌コンピューティングシステム, 情報処理学会, 47巻, SIG12号, 掲載ページ 108-118, 出版日 2006年, 査読付
日本語

An FPGA-based Visualization Accelerator : VisA Pro
Symposium on VLSI (GLSVLSI; oster presentation; Ma; S. Mori; D. Okamura; H. Shimada; S. Miwa; Y. Nakashima; S. Tomita
International Symposium on Advanced Reconfigurable Systems, poster巻, 出版日 2005年, 査読付
研究論文（国際会議プロシーディングス）, 英語

記憶構造観測のための神経網シミュレーション
津邑公暁; 三輪忍; 五島正裕; 富田眞治
計測自動制御学会システム工学部会研究会「人工生命の新しい潮流」計測自動制御学会, 掲載ページ 111-114, 出版日 2000年02月, 査読付
研究論文（その他学術会議資料等）, 日本語

MISC

Exploring AXI4 Transaction Support in RIKEN CGRA Architecture
J. Liu; B. Adhi; C. Shi; S. Miwa; K. Sano
出版日 2025年09月, 電子情報通信学会技術研究報告RECONF2025-67, 掲載ページ 85-90

SRv6 Functionを用いた適応的ソースルーティング
石山結月; 三輪忍; 本多弘樹; 八巻隼人
出版日 2025年08月, 掲載ページ 19-24

XDPを用いたパケット圧縮転送システム
新井涼太郎; 三輪忍; 本多弘樹; 八巻隼人
出版日 2025年08月, 電子情報通信学会技術研究報告CPSY2025-26, 掲載ページ 13-18

複数長文字列探索に適したラビン-カープ法の完全一致比較の高速化
又吉佑亮; 三輪忍; 本多弘樹; 八巻隼人
出版日 2025年08月, 電子情報通信学会技術研究報告CPSY2025-25, 掲載ページ 7-12

Enabling Systolic Computing on Elastic Coarse-Grained Reconfigurable Array for HPC and AI
C. Shi; B. Adhi; Lin Teng; S. Miwa; K. Sano
出版日 2025年06月, 2025 62nd ACM/EDAC/IEEE Design Automation Conference (DAC), Work-in-Progress Session (poster presentation), 査読付

MOOPSE: Leveraging High-Radix Booth Encoders for Area-Efficient Matrix Multiply Operations
C. Shi; T. Koizumi; R. Shioya; H. Yamaki; H. Honda; S. Miwa
ラスト(シニア)オーサー, 出版日 2025年06月, 2025 62nd ACM/EDAC/IEEE Design Automation Conference (DAC), Work-in-Progress Session (poster presentation), 査読付

共同研究・競争的資金等URL

GPT-4oのMPI並列コード生成能力の分析
田中凛; 八巻隼人; 三輪忍; 本多弘樹
出版日 2025年03月, 情報処理学会研究報告 2025-HPC-198, 53号, 掲載ページ 1-7

NUMA構成とGramineバージョンがIntel SGXの性能に与える影響の評価
佐野拳紳; 下島航太; 八巻隼人; 本多弘樹; 三輪忍
ラスト(シニア)オーサー, 出版日 2025年03月, 情報処理学会研究報告 2025-HPC-198, 51号, 掲載ページ 1-8

Intel SGXを用いた並列計算環境のための暗号化MPI通信ライブラリ
下島航太; 八巻隼人; 本多弘樹; 松尾真一郎; 三輪忍
ラスト(シニア)オーサー, 出版日 2025年03月, 情報処理学会研究報告 2025-HPC-198, 48号, 掲載ページ 1-8

GPUにおける神経回路シミュレータの高速化
鈴木嘉竜; 八巻隼人; 本多弘樹; 三輪忍
ラスト(シニア)オーサー, 出版日 2025年03月, 情報処理学会研究報告 2025-HPC-198, 43号, 掲載ページ 1-7

CNFET製4T SRAMの安定性の評価
苗田友之助; 八巻隼人; 本多弘樹; 三輪忍
ラスト(シニア)オーサー, 出版日 2025年03月, 情報処理学会研究報告 2024-SLDM-208, 45号, 掲載ページ 1-8

大局的および局所的な経路制御を併用したマルチパス負荷分散手法
佐藤翔; 三輪忍; 本多弘樹; 八巻隼人
出版日 2025年03月, 情報処理学会研究報告 2024-ARC-260, 42号, 掲載ページ 1-6

ルーティングテーブル検索におけるマルチプレフィクス長キャッシュの構成
都地佑月; 五島正裕; 三輪忍; 本多弘樹; 八巻隼人
出版日 2025年03月, 情報処理学会研究報告 2024-ARC-260, 39号, 掲載ページ 1-8

並列計算システムにおける情報漏洩を防止するTEEの利用方法の研究
下島航太; 八巻隼人; 本多弘樹; 松尾真一郎; 三輪忍
ラスト(シニア)オーサー, 出版日 2024年09月, コンピュータセキュリティシンポジウム2024（ポスター）

Linux上に実装した通信遅延計測手法の精度評価
山口圭亮; 八巻隼人; 三輪忍; 本多弘樹
出版日 2024年06月, 情報処理学会研究報告 2024-ARC-257, 21号, 掲載ページ 1-6

Open vSwitchにおけるフローテーブルミスバッファの提案
丸山颯斗; 八巻隼人; 三輪忍; 本多弘樹
出版日 2024年06月, 情報処理学会研究報告 2024-ARC-257, 9号, 掲載ページ 1-7

LSTMによるジョブの実行時間予測および予測実行時間と要求実行時間を併用するジョブスケジューリング
久保優也; 吉田幸平; 三輪忍; 八巻隼人; 本多弘樹
出版日 2024年03月, 情報処理学会研究報告, 2023巻, HPC-193号

TCAMを用いずにルータの最長一致検索に対応するキャッシュ-メモリ・システム
長田大樹; 八巻隼人; 三輪忍; 本多弘樹; 五島正裕
出版日 2023年08月, 情報処理学会研究報告(Web), 2023巻, ARC-252号, 202302240000482906

高帯域幅メモリを有するプロセッサにおけるデータプリフェッチャの性能分析
トウリン; 三輪忍; 塩谷亮太; 八巻隼人; 本多弘樹
出版日 2023年08月, 情報処理学会研究報告(Web), 2023巻, ARC-254号, 202302264598073999

IP網におけるIn-networkコンテンツキャッシュ
大河原幸哉; 八巻隼人; 三輪忍; 本多弘樹
出版日 2023年07月, 情報処理学会研究報告(Web), 2023巻, IOT-62号, 202302266587998625

マルチパスルーティングにおけるINTを応用した帯域要求量ベースの動的トラフィック分散
佐藤翔; 荒巻慎太朗; 八巻隼人; 三輪忍; 本多弘樹
出版日 2023年07月, 情報処理学会研究報告(Web), 2023巻, IOT-62号, 202302267351118270

検査対象の種類ごとに特化したSnortを複数用いたソフトウェア侵入検知システムの並列化
小倉快将; 八巻隼人; 本多弘樹; 三輪忍
出版日 2023年06月, 情報処理学会研究報告(Web), 2023巻, ARC-253号, 202302225450390001

処理性能の異なる機器を複数台用いた並列NIDSに対するロードバランサ
八巻隼人; 三輪忍; 本多弘樹
出版日 2023年06月, 電子情報通信学会技術研究報告(Web), 123巻, 62(CPSY2023 1-7)号, 2432-6380, 202302236336502031

実HPCアプリケーションを用いたマルチGPUにおける電力ばらつきの評価
郡司賢; 吉田幸平; 三輪忍; 八巻隼人; 本多弘樹
出版日 2023年03月, 情報処理学会研究報告(Web), 2023巻, HPC-188号, 202302264623200051

A64FXプロセッサにおける電力・性能ばらつきの評価・分析
草場智也; 吉田幸平; 三輪忍; 八巻隼人; 本多弘樹
出版日 2023年03月, 情報処理学会研究報告(Web), 2023巻, HPC-188号, 202302265328292538

並列アプリケーションのキャッシュミス数予測の評価
長谷川健人; 有馬海人; 三輪忍; 八巻隼人; 本多弘樹
出版日 2023年03月, 情報処理学会研究報告(Web), 2023巻, HPC-188号, 202302277125915058

GPUサーバにおける画像認識を行う深層学習の性能モデリング
松下哲也; 三輪忍; 八巻隼人; 本多弘樹
出版日 2023年03月, 電子情報通信学会技術研究報告(Web), 122巻, 451(CPSY2022 34-55)号, 2432-6380, 202302236656577507

ソフトウェアベース電力サイドチャネル攻撃の対抗策の評価
下島航太; 三輪忍; 八巻隼人; 本多弘樹
出版日 2023年03月, 電子情報通信学会技術研究報告(Web), 122巻, 451(CPSY2022 34-55)号, 2432-6380, 202302236713517810

複数パターン長を有するマルチパターンマッチングにおけるラビン-カープ法のハッシュ関数最適化
鈴木想生; 八巻隼人; 三輪忍; 本多弘樹
出版日 2023年03月, 電子情報通信学会技術研究報告(Web), 122巻, 451(CPSY2022 34-55)号, 2432-6380, 202302287281843795

リンク集約におけるトラフィック負荷分散方式の検討
平野愁也; 八巻隼人; 三輪忍; 本多弘樹
出版日 2023年03月, 情報処理学会研究報告(Web), 2023巻, ARC-252号, 202302266722204411

SRAMの電力/遅延シミュレータCACTIのCNFETへの対応
関川栄一郎; 三輪忍; ヨウドウキン; 塩谷亮太; 八巻隼人; 本多弘樹
出版日 2022年07月, 情報処理学会研究報告(Web), 2022巻, ARC-249号, 202202244716289108

CUDAバージョンの違いがカーネルの実行時間と消費電力に与える影響の分析
吉田幸平; 三輪忍; 八巻隼人; 本多弘樹
出版日 2022年, 情報処理学会研究報告(Web), 2022巻, HPC-183号, 202202242346420364

In-band Network Telemetryによるリンク混雑度に応じたマルチパス経路制御
荒巻慎太朗; 田中京介; 八巻隼人; 三輪忍; 本多弘樹
出版日 2022年, 電子情報通信学会技術研究報告(Web), 122巻, 16(NS2022 8-22)号, 2432-6380, 202202251502143401

CPUおよびGPUの電力ばらつきを考慮したジョブスケジューリング手法の提案
小野賢人; 吉田幸平; 三輪忍; 坂本龍一; 八巻隼人; 本多弘樹
出版日 2022年, 情報処理学会研究報告(Web), 2022巻, HPC-185号, 202202239933175791

OpenMP/OpenACCハイブリッド並列化のためのコード変換フレームワークの提案
川崎真之; 大島聡史; 八巻隼人; 三輪忍; 本多弘樹
出版日 2022年, 情報処理学会研究報告(Web), 2022巻, HPC-187号, 202202284613935034

LULESHを対象とした関数コール回数予測
有馬海人; 長谷川健人; 三輪忍; 八巻隼人; 本多弘樹
出版日 2022年, 情報処理学会研究報告(Web), 2022巻, HPC-187号, 202202286265964027

マルウェア解析のための高速かつ安全なVMI機構
森, 瑞穂; 味曽野, 雅史; 八巻, 隼人; 三輪, 忍; 本多, 弘樹; 品川, 高廣
マルウェアの挙動や攻撃手法を解析する手段として，仮想マシン上のプログラムの内部状態を観察するVirtual Machine Introspection (VMI)という手法が用いられている．VMIには、主に外部のハイパーバイザから行うOut-of-the-box方式と仮想マシン内部から行うIn-the-box方式の2つがあるが，両者は解析時の動作速度の高速性と解析システムを保護・隠蔽する安全性の面でトレードオフの関係にある．そこで我々は，高速かつ安全なVMI機構としてFastVMIXを提案する．FastVMIXでは，マルウェアを解析する解析エージェントを仮想マシン内部に挿入することによってハイパーバイザへのコンテキストスイッチを減らしつつ，Intel CPUがサポートするVMFUNCのEPTP SwitchingとHuge Pageを用いた高速な動的メモリ保護変更機構により、マルウェアから解析エージェントのメモリ領域を保護・隠蔽する．また，準パススルー型ハイパーバイザを用いることで、仮想化のオーバーヘッド削減及び隠蔽度の向上を図る．本論文では，BitVisorをベースにFastVMIXを実装した結果を報告する．
As a means of quickly analyzing malware behavior and attack methods, a technique called Virtual Machine Introspection (VMI) is used to observe the internal state of programs on a virtual machine. A typical VMI system mainly takes either an out-of-the-box (i.e., with hypervisor) or in-the-box (i.e., within the virtual machine) approach; however, these two approaches involve a trade-off between the analysis speed and the security of protectiong and hiding the analysis system. In this paper, we propose FastVMIX that realizes fast and secure VMI. FastVMIX reduces the number of context switches to the hypervisor during malware analysis by inserting an analysis agent in the target virtual machine, while protecting and hiding the agent's memory area by switching memory protection with EPTP switching of VMFUNC and huge pages supported by Intel CPUs. In addition, we used a para-pass-through hypervisor to reduce the overhead of virtualization and improve the degree of hiding. This paper reports several experimental results of FastVMIX built on BitVisor., 出版日 2021年11月25日, コンピュータシステム・シンポジウム論文集, 2021巻, 掲載ページ 48-56, 日本語, 170000185943
URL

MPIアプリケーションの関数コール回数予測
有馬海人; 長谷川健人; 三輪忍; 八巻隼人; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, HPC-178号, 202102222474724022

MPIアプリケーションのキャッシュプロファイル予測
長谷川健人; 有馬海人; 三輪忍; 八巻隼人; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, HPC-178号, 202102245178693852

Routing/ARP/ACL/QoSごとのテーブル分離パケット処理キャッシュ
長田大樹; 田中京介; 八巻隼人; 三輪忍; 本多弘樹; 五島正裕
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, ARC-244号, 202102212200475516

TensorFlowアプリケーション用GPUサーバにおけるNVDIMMの利用可能性の検討
松下哲也; 三輪忍; 八巻隼人; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, ARC-244号, 202102288818448896

Mesh TensorFlowを用いたモデル並列学習におけるCPU-GPU間のデータ転送最適化
横手宥則; 三輪忍; 八巻隼人; 本多弘樹
出版日 2021年, 電子情報通信学会技術研究報告(Web), 120巻, 435(CPSY2020 50-69)号, 2432-6380, 202102235623871899

Wisteria/BDEC-01におけるNVIDIA A100 GPUの電力性能ばらつきの評価
提山春日; 吉田幸平; 三輪忍; 八巻隼人; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, HPC-182号, 202102219931012939

SDNコントローラにおける優先度付きキューを用いた高優先度パケットの処理高速化
高倉玲央; 八巻隼人; 三輪忍; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, ARC-246号, 202102229681366351

深層学習における実行時ファイルステージング
樋口遼太郎; 三輪忍; 八巻隼人; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, HPC-182号, 202102244061258213

MPIにおける小規模実行時の通信トレース解析による大規模実行時の通信タイミング予測の評価
岡田悠希; 三輪忍; 八巻隼人; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, HPC-182号, 202102265589208738

カーボンナノチューブトランジスタを用いて論理合成したプロセッサの電力/面積/回路遅延評価
佐々木魁; 三輪忍; ヨウドウキン; 塩谷亮太; 八巻隼人; 本多弘樹
出版日 2021年, 情報処理学会研究報告(Web), 2021巻, ARC-245号, 202102251997160736

ネットワーク機器における高速なGZIP復号のためのキャッシュ利用効率向上手法
黒川雄亮; 八巻隼人; 三輪忍; 本多弘樹
出版日 2020年, 電子情報通信学会技術研究報告, 119巻, 429(DC2019 98-121)(Web)号, 0913-5685, 202002211528472983

動画トラフィック検査除外手法のSnortにおける実装
祐野雅範; 八巻隼人; 三輪忍; 本多弘樹
出版日 2020年, 電子情報通信学会技術研究報告, 119巻, 429(DC2019 98-121)(Web)号, 0913-5685, 202002260646532043

パケット処理キャッシュにおけるパイプライン化とマルチポート化の評価
田中京介; 八巻隼人; 三輪忍; 本多弘樹
出版日 2019年, 情報処理学会研究報告(Web), 2019巻, ARC-237号, 201902240481337109

多頻度・順不同で到着するシーケンスデータの主キーごとの処理順序制約を満たすリアルタイム並列処理手法
山添高弘; 山添高弘; 三輪忍; 本多弘樹
出版日 2019年, 情報処理学会研究報告(Web), 2019巻, DBS-169号, 201902235140320625

TSUBAME3.0における製造ばらつきを考慮したGPUの電力モデリングの高速化
大八木哲哉; 浅田風太; 三輪忍; 八巻隼人; 本多弘樹
出版日 2019年, 情報処理学会研究報告(Web), 2019巻, HPC-172号, 202002234496157254

テーブル検索回数の削減によるインターネットルータの高スループット化および省電力化
山下壮樹; 八巻隼人; 三輪忍; 本多弘樹
出版日 2019年, 電子情報通信学会技術研究報告, 119巻, 343(IA2019 48-58)(Web)号, 0913-5685, 202002264724684120

OpenFlowを用いた動画フローの非ミラーリングによるNIDS処理負荷の削減
高倉玲央; 八巻隼人; 三輪忍; 本多弘樹
出版日 2019年, 電子情報通信学会技術研究報告, 119巻, 343(IA2019 48-58)(Web)号, 0913-5685, 202002285135458100

ネットワーク機器上における高速なGZIP復号のためのキャッシュ利用効率向上手法の提案
黒川雄亮; 八巻隼人; 三輪忍; 本多弘樹
出版日 2019年, 電子情報通信学会大会講演論文集(CD-ROM), 2019巻, 1349-144X, 201902210265635577

学習済み重みを利用した畳み込みニューラルネットワークの学習法の初期検討
横手宥則; 三輪忍; 井内悠太; 津邑公暁; 八巻隼人; 本多弘樹
出版日 2019年, 電子情報通信学会大会講演論文集(CD-ROM), 2019巻, 1349-144X, 201902220924867022

キャッシュを利用したOpenFlow通信の高速化
祐野雅範; 三輪忍; 八巻隼人; 本多弘樹
出版日 2019年, 電子情報通信学会大会講演論文集(CD-ROM), 2019巻, 1349-144X, 201902227184856037

GPUの電力ばらつきモデリング
浅田風太; 三輪忍; 本多弘樹; 八巻隼人
出版日 2019年, 電子情報通信学会大会講演論文集(CD-ROM), 2019巻, 1349-144X, 201902281110920126

ネットワークベースの攻撃に対応可能な高対話型ハニーポット
森瑞穂; 八巻隼人; 三輪忍; 本多弘樹
出版日 2019年, 電子情報通信学会大会講演論文集(CD-ROM), 2019巻, 1349-144X, 201902217092133421

ON/OFFリンクにおける通信開始遅延を低減するためのプリウェイクアップ手法の検討
松山, 朋樹; 三輪, 忍; 八巻, 隼人; 本多, 弘樹
近年のスーパーコンピュータの消費電力は、供給可能な電力に達しつつあり、システム内の各ハードウェアの消費電力をさらに削減する必要がある。スーパーコンピュータのインターコネクション・ネットワークにおける省電力化技術として、通信していないリンクを低電力モードにすることが可能なON/OFFリンクが注目されている。しかし、低電力モード時に通信要求があった場合まず通常モードにする必要があり、そのモード遷移にかかる時間分、通信の開始が遅延してしまう。そこで、本研究では、低電力モードのリンクを通信要求に先立って通常モードにし(プリウェイクアップ)、データ到着後直ちに通信を開始できるようにする方法を検討する。, 出版日 2018年03月13日, 第80回全国大会講演論文集, 2018巻, 1号, 掲載ページ 123-124, 日本語, 201802252881916162, 170000176601, AN00349328
URL

CNN計算の省メモリ化のためのカーネル・クラスタリング手法の検討—A Study of Kernel Clustering for Reducing Memory Footprint of CNN—コンピュータシステム ; 組込み技術とネットワークに関するワークショップETNET2018
松井優樹; 三輪忍; 進藤智司; 津邑公暁; 八巻隼人; 本多弘樹
電子情報通信学会, 出版日 2018年03月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 479号, 掲載ページ 185-190, 日本語, 0913-5685, 40021521631, AA1123312X
URL

NVDIMMを用いたメモリスナップショットの解析システム—A System for Analyzing Memory Snapshot with NVDIMM—ディペンダブルコンピューティング ; 組込み技術とネットワークに関するワークショップETNET2018
三須雅仁; 三輪忍; 八巻隼人; 本多弘樹
電子情報通信学会, 出版日 2018年03月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 480号, 掲載ページ 107-112, 日本語, 0913-5685, 40021521593, AA1123312X
URL

カーネルの類似性に基づく近似計算を行うCNNアクセラレータの検討—コンピュータシステム ; 組込み技術とネットワークに関するワークショップETNET2018
進藤智司; 松井優樹; 八巻隼人; 津邑公暁; 三輪忍
電子情報通信学会, 出版日 2018年03月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 479号, 掲載ページ 179-184, 日本語, 0913-5685, 201802232250185293, 40021521629, AA1123312X
URL

ゲートウェイにおける攻撃パケットに着目したテーブル検索負荷削減手法の提案—ディペンダブルコンピューティング ; 組込み技術とネットワークに関するワークショップETNET2018
愛甲達也; 八巻隼人; 三輪忍; 本多弘樹
電子情報通信学会, 出版日 2018年03月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 480号, 掲載ページ 89-94, 日本語, 0913-5685, 201802212922943301, 40021521583, AA1123312X
URL

HSPICEを用いたシリコン回路とカーボンナノチューブ回路の比較評価—ディペンダブルコンピューティング ; 組込み技術とネットワークに関するワークショップETNET2018
松尾駿; 三輪忍; 八巻隼人; 本多弘樹
電子情報通信学会, 出版日 2018年03月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 480号, 掲載ページ 119-124, 日本語, 0913-5685, 201802283716598713, 40021522224, AA1123312X
URL

DFS/DCT制御による電力あたり性能の実行時最適化
三吉郁夫; 三輪忍; 井上弘士; 近藤正章
出版日 2018年, 情報処理学会研究報告(Web), 2018巻, HPC-163号, 201802270411095874

NVDIMMを用いたメモリスナップショットの解析システム
三須雅仁; 三輪忍; 八巻隼人; 本多弘樹
出版日 2018年, 電子情報通信学会技術研究報告, 117巻, 480(DC2017 89-106)号, 0913-5685, 201802277611652387

CNN計算の省メモリ化のためのカーネル・クラスタリング手法の検討
松井優樹; 三輪忍; 進藤智司; 津邑公暁; 八巻隼人; 本多弘樹
出版日 2018年, 電子情報通信学会技術研究報告, 117巻, 480(DC2017 89-106)号, 0913-5685, 201802279006502398

プリウェイクアップ手法によるON/OFFリンクの消費エネルギー削減
松山朋樹; 三輪忍; 八巻隼人; 本多弘樹
出版日 2018年, 情報処理学会研究報告(Web), 2018巻, HPC-165号, 201802210749233668

1Tbps実現に向けたルータのメモリ階層の最適化
田中京介; 八巻隼人; 三輪忍; 本多弘樹
出版日 2018年, 情報処理学会研究報告(Web), 2018巻, ARC-233号, 201902221895431753

高電力効率なCNNアクセラレータ実現に向けたカーネルクラスタリングの応用の検討 (コンピュータシステム)
進藤智司; 松井優樹; 八巻隼人; 津邑公暁; 三輪忍
電子情報通信学会, 出版日 2017年07月26日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 153号, 掲載ページ 65-73, 日本語, 0913-5685, 201702211184429190, 40021284637
URL

高電力効率なCNNアクセラレータ実現に向けたカーネルクラスタリングの応用の検討 (ディペンダブルコンピューティング)
進藤智司; 松井優樹; 八巻隼人; 津邑公暁; 三輪忍
電子情報通信学会, 出版日 2017年07月26日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 154号, 掲載ページ 41-49, 日本語, 0913-5685, 40021286119
URL

動画トラフィックに着目したNIDSにおける文字列探索処理負荷削減手法の提案
高徳真晴; 八巻隼人; 三輪忍; 本多弘樹
電子情報通信学会, 出版日 2017年07月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 153号, 掲載ページ 177-183, 日本語, 0913-5685, 201702201099810955, 40021286172, AA1123312X
URL

パケット処理キャッシュにおける送信元IPアドレスに着目したミス削減手法に関する初期検討
八巻隼人; 愛甲達也; 三輪忍; 本多弘樹
電子情報通信学会, 出版日 2017年05月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 44号, 掲載ページ 55-62, 日本語, 0913-5685, 201702227542455634, 40021215515, AA1123312X
URL

マルチコアニューラルネットワークアクセラレータにおけるデータ転送のブロードキャスト化—ディペンダブルコンピューティング ; 組込み技術とネットワークに関するワークショップETNET2017
大場百香; 三輪忍; 進藤智司; 津邑公暁; 八巻隼人; 本多弘樹
電子情報通信学会, 出版日 2017年03月, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116巻, 511号, 掲載ページ 165-170, 日本語, 0913-5685, 201702248211492751, 40021158854, AA1123312X
URL

ジョブ実行中の計算ノードにおけるDIMM待機電力削減手法の実装と評価
石原雅也; 石原雅也; 三輪忍; 三輪忍; 八巻隼人; 八巻隼人; 本多弘樹; 本多弘樹
出版日 2017年, 情報処理学会研究報告(Web), 2017巻, HPC-158号, 201702274862027744

電力性能推定を目的としたインターコネクト・シミュレータTraceRPの開発
小野貴継; 垣深悠太; 三輪忍; 井上弘士
出版日 2017年, 情報処理学会研究報告(Web), 2017巻, HPC-161号, 201702243126684906

再構成可能なニューラルネットワークアクセラレータの提案と性能分析 (コンピュータシステム)
大場百香; 三輪忍; 進藤智司; 津邑公暁; 八巻隼人; 本多弘樹
電子情報通信学会, 出版日 2016年08月08日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116巻, 177号, 掲載ページ 235-242, 日本語, 0913-5685, 201602282821771867, 40020932410
URL

ニューラルネットワークアクセラレータにおけるコア間通信量最小化のためのタスク配置手法 (コンピュータシステム)
進藤智司; 大場百香; 津邑公暁; 三輪忍
電子情報通信学会, 出版日 2016年08月08日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116巻, 177号, 掲載ページ 243-250, 日本語, 0913-5685, 201602248836614037, 40020932412
URL

リンクオフスレッショルドを有するON/OFFリンクの電力見積手法の初期検討
西郷雄斗; 三輪忍; 八巻隼人; 本多弘樹
出版日 2016年, 情報処理学会研究報告(Web), 2016巻, HPC-155号, 201602251172366586

メモリホットプラグを用いたメインメモリの省電力化に関する初期検討
石原雅也; 石原雅也; 三輪忍; 三輪忍; 八巻隼人; 八巻隼人; 本多弘樹; 本多弘樹
出版日 2016年, 情報処理学会研究報告(Web), 2016巻, HPC-155号, 201602256412247012

ヘテロジニアス・プロセッサの設計探索手法の初期検討
澁谷俊憲; 三輪忍; 塩谷亮太; 佐々木広; 八巻隼人; 本多弘樹
出版日 2016年, 電子情報通信学会技術研究報告, 116巻, 177(CPSY2016 10-40)号, 0913-5685, 201602240060831500

TLBミスペナルティ削減のための大容量LLCの利用法に関する初期検討
有間英志; 三輪忍; 中田尚; 中村宏
近年，不揮発性メモリや 3 次元積層技術等デバイス技術の進歩によって，これまで以上に大容量のメモリをオンチップに実装することが可能となりつつある．また，この様な大容量メモリをラスト・レベル・キャッシュ (LLC) として用いる利用法が提案され，大幅な性能向上が可能であることが示されてきた．しかし，これまでの大容量 LLC に関する先行研究では，TLB ミスペナルティの影響については，十分な考慮がなされてこなかった．LLC の大容量化に伴い，LLC 上に格納されたデータの内，当該ページアドレスが TLB 上に存在しないものの割合は増大する．その様なデータがアクセスされると TLB ミスが発生し，キャッシュもしくはメインメモリ上に存在する当該ページテーブルエントリへのアクセスが発生する．この TLB ミスペナルティの影響を削減することは，今後 LLC の大容量化がさらに進むにつれて極めて重要となる．そこで本研究では，大容量 LLC 上において，ページテーブルエントリを保持するラインの存在割合を最適化し，ページテーブルへのアクセスの殆どを LLC 上でヒットさせることによって，TLB ミスペナルティの削減を目指す．本稿では，これを行うためのキャッシュリプレイスメントアルゴリズムを検討し評価を行った．, 一般社団法人情報処理学会, 出版日 2015年01月22日, 研究報告計算機アーキテクチャ（ARC）, 2015巻, 7号, 掲載ページ 1-6, 日本語, 110009866537, AN10096105
URL

TLBミスペナルティ削減のための大容量LLCの利用法に関する初期検討(集積回路とアーキテクチャの協創「ロボット,ヒューマノイド,AI技術及び一般」)
有間英志; 三輪忍; 中田尚; 中村宏
近年,不揮発性メモリや3次元積層技術等デバイス技術の進歩によって,これまで以上に大容量のメモリをオンチップに実装することが可能となりつつある.また,この様な大容量メモリをラスト・レベル・キャッシュ(LLC)として用いる利用法が提案され,大幅な性能向上が可能であることが示されてきた.しかし,これまでの大容量LLCに関する先行研究では,TLBミスペナルティの影響については,十分な考慮がなされてこなかった.LLCの大容量化に伴い,LLC上に格納されたデータの内,当該ページアドレスがTLB上に存在しないものの割合は増大する.その様なデータがアクセスされるとTLBミスが発生し,キャッシュもしくはメインメモリ上に存在する当該ページテーブルエントリへのアクセスが発生する.このTLBミスペナルティの影響を削減することは,今後LLCの大容量化がさらに進むにつれて極めて重要となる.そこで本研究では,大容量LLC上において,ページテーブルエントリを保持するラインの存在割合を最適化し,ページテーブルへのアクセスの殆どをLLC上でヒットさせることによって,TLBミスペナルティの削減を目指す.本稿では,これを行うためのキャッシュリプレイスメントアルゴリズムを検討し評価を行った., 一般社団法人電子情報通信学会, 出版日 2015年01月22日, 電子情報通信学会技術研究報告. ICD, 集積回路, 114巻, 436号, 掲載ページ 37-42, 日本語, 0913-5685, 201502261898390010, 110010010030, AN10013276

演算器におけるオペランド値を考慮したパワーゲーティングに関する初期検討
石川雄介; 小柴篤史; 坂本龍一; 和田康孝; 三輪忍; 近藤正章; 並木美太郎; 本多弘樹
出版日 2015年, 電子情報通信学会技術研究報告, 115巻, 243(CPSY2015 45-60)号, 0913-5685, 201502202570022719

SWoPP新潟2015開催報告
山田浩史; 大川猛; 勝康夫; 三輪忍; 遠藤敏夫; 多田野寛人; 高宮安仁; 窪田昌史; 鯉渕道絃; 五島正裕
出版日 2015年, 情報処理, 56巻, 12号, 掲載ページ 1220-1223, 日本語, 記事・総説・解説・論説等（学術雑誌）

アクセスの局所性に着目したSTT-MRAMキャッシュの周辺回路の電源制御手法
有間英志; 野口紘希; 中田尚; 三輪忍; 武田進; 藤田忍; 中村宏
プロセッサの消費するリーク電力は，半導体の微細化が進むにつれて増大してきた．特にキャッシュのリーク電力は，回路面積が大きいために，プロセッサの消費電力の大部分を占めている．この問題に対処するため，STT-MRAM といった不揮発性メモリをキャッシュに適用する試みが近年なされている．しかし，STT-MRAM で構成されたキャッシュでは，メモリセルのリーク電力は無視できる程小さいが，周辺回路のリーク電力が大きくなるという問題があった．そのため，性能低下を抑えつつこれを削減する様な技術が必要となる．そこで本研究では，STT-MRAM キャッシュの周辺回路に対して，細粒度に電源制御を行う技術を提案する．具体的には，サブアレイ単位の電源制御を行い，各サブアレイに対して一定時間アクセスがなければ，そのサブアレイに対する電源供給を遮断する．また，電力削減効果をさらに増大させるため，各サブアレイに対するアクセスの時空間的な局所性を向上させる技術も提案する．評価の結果，最新の STT-MRAM を適用したラスト・レベル・キャッシュにおいて 80%程度のリーク電力の削減が可能であることが分かった．, 一般社団法人情報処理学会, 出版日 2014年07月21日, 研究報告計算機アーキテクチャ（ARC）, 2014巻, 11号, 掲載ページ 1-6, 日本語, 201502259588427288, 110009808091

FPGAを用いたDalvikアクセラレータの実装と評価
老子裕輝; 吉實大輔; 太田淳; 三輪忍; 中條拓伯
Android 端末において，Java で記述されたアプリケーションは Dalvik バイトコードと呼ばれる中間コードに変換され，さらに Dalvik 仮想マシンを介して実行される．この VM によるコード実行は性能低下やメモリ使用量の増加といった様々な問題を引き起こすが，この問題に対して我々はハードウェアで直接中間コードを実行する Dalvik アクセラレータを提案してきた．これまで我々はアクセラレータの構造の提案や生成コードに関する予備評価を行った．本研究では新たに，Dalvik アクセラレータを実際に FPGA 上において MIPS プロセッサとともに実装し，評価を行った結果，プログラムの実行時間を大幅に削減できることがわかった．本稿では，その実装の詳細と評価結果について報告する．On an Android device, a Java application is compiled to the intermediate code called as Dalvik bytecode and then run with Dalvik Virtual Machine. Such a execution model causes performance degradation and memory wastage. In order to solve this issue, we have proposed a Dalvik accelerator which directly executes an intermediate code with specialized hardware. Previous studies by our group have shown architecture and preliminary evaluation about generated code. Therefore, in this study, we have implemented the accelerator as well as a pipelined MIPS processor on FPGA to evaluate our proposed mechanism. The result shows that the proposed mechanism significantly improves performance for some programs. Here we report detailed implementation and evaluation results., 一般社団法人情報処理学会, 出版日 2014年05月12日, 研究報告組込みシステム（EMB）, 2014巻, 3号, 掲載ページ 1-8, 日本語, 0919-6072, 201502297254336906, 110009767029, AA12149313
URL

電力制約下における蓄電池を用いたHPCシステムの性能向上
酒井崇至; 薦田登志矢; 三輪忍; 中村宏
HPC システムの大規模化に伴い，電力供給系，冷却系の建設コストの増大，運用コストの増大が深刻になっている．こうしたコストを削減する目的で，電力供給系をオーバープロビジョニングすることで電力供給系の使用効率を高める設計手法が提案されている．このような設計手法を用いるためには，運用時に計算機資源に電力制約を課す電力管理手法が必要となる．しかし，従来の電力管理手法を適用した場合，性能低下が大きく問題があった．そこで本論文では，蓄電池を用いて時間方向に電力を融通し，電力制約下における性能向上を実現するパワーシフティング手法を提案する．提案手法では，停電時のために設置されている UPS （無停電電源装置）内の蓄電池と周波数制御を併用し，電力を投入しても性能が上がりにくいフェーズから，電力を投入することで性能が大きく上がるフェーズへ電力を融通することで高い性能を達成する．評価の結果，提案手法を用いることで，従来の周波数制御を用いた電力制約制御手法に対して，CPU アプリケーションで平均 4.5%，GPU アプリケーションで平均 17.1%の性能向上が実現できることを示した．, 一般社団法人情報処理学会, 出版日 2014年02月24日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2014巻, 25号, 掲載ページ 1-6, 日本語, 201502260905452860, 110009675739, AN10463942
URL

ロードバランスを考慮した電力制約下におけるCPUのDVFS制御
會田翔; 三輪忍; 中村宏
現在の大規模計算環境においては，実質的に利用可能な電力の限界が見えてきたことで電力制約が性能向上の妨げとなっている．近年そういった環境下において必要となる性能対電力のトレードオフの調整を行う技術が発達してきた．本稿では，電力効率改善のため，CPU 間のロードバランス改善のためのランタイム制御手法を提案し，最大 21.3%の性能向上を達成した．, 一般社団法人情報処理学会, 出版日 2014年02月24日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2014巻, 23号, 掲載ページ 1-8, 日本語, 201502243125090230, 110009675737, AN10463942
URL

物理メモリの増減による電力制約下でのHPCシステムの性能向上
米澤亮太; 會田翔; 三輪忍; 中村宏
近年の HPC システムの規模はその消費電力によって制限されている．今後，HPC システムの処理能力をさらに向上させ，エクサフロップスを実現するためには，消費電力を増やすことなくシステムの処理能力のみを向上させる技術が必要不可欠である．HPC システムには大量の物理メモリが搭載されているが，使用メモリ量はアプリケーションによって異なっており，全ての物理メモリを必要とするケースは少ないと考えられる．そこで本研究では，アプリケーションに応じて使用する物理メモリ量を変更することにより，メモリの消費電力を節約する．そうして削減した分の電力を CPU 周波数の向上に費すことにより，電力制約下でのシステム性能を改善する．評価の結果，最大 27.8%の性能向上が得られることを確認した．, 一般社団法人情報処理学会, 出版日 2014年02月24日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2014巻, 24号, 掲載ページ 1-8, 日本語, 201502206149132135, 110009675738, AN10463942
URL

ターボ・モード強化のための面積効率に優れたマイクロプロセッサとその設計手法
三輪忍; 井上聖等; 中村宏
多くのプログラムを加速できるターボ・モードは商用プロセッサにおいて広く採用されている．ターボ・モード中に利用できる最大動作周波数は，CPU 負荷の大きいプログラムを用いた温度試験を通じて，温度制約違反を起こさないようにある程度の温度マージンを設けた上で定められている．したがって，プログラム実行中のプロセッサの温度上昇を抑えることができれば，同一温度マージンのもとでより高い動作周波数を利用することができ，その結果，ターボ・モードによる性能向上効果を高めることができる．本論では，少量のハードウェアを追加することでプロセッサの温度上昇を抑制し，ターボ・モードの能力を増強する方法について述べる．また，そのようなプロセッサの設計手法も併せて提案する．評価の結果，提案手法により 2.8%の面積増加で最大 14.5%の性能向上を達成した．, 一般社団法人情報処理学会, 出版日 2014年01月16日, 研究報告計算機アーキテクチャ（ARC）, 2014巻, 12号, 掲載ページ 1-10, 日本語, 201502290583202479, 110009658692, AN10096105
URL

ダーク・シリコン時代のプロセッサ・アーキテクチャに関する初期検討
三輪忍; 塩谷亮太; 佐々木広
出版日 2014年, 情報処理学会研究報告(Web), 2014巻, ARC-211号, 201502292808743566

回路資源の投入により電力効率を改善するプロセッサ・アーキテクチャ
三輪忍; 塩谷亮太; 佐々木広
出版日 2014年, 情報処理学会研究報告(Web), 2014巻, ARC-212号, 201502236873120625

Design Aid of Multi-core Embedded Systems with Energy Model
Nakada Takashi; Okamoto Kazuya; Komoda Toshiya; Miwa Shinobu; Sato Yohei; Ueki Hiroshi; Hayashikoshi Masanori; Shimizu Toru; Nakamura Hiroshi
Shifting to multi-core designs is so pervasive a trend to overcome the power wall and it is a necessary move for embedded systems in our rapidly evolving information society. Meanwhile, the need to increase the battery life and reduce maintenance costs for such embedded systems is very critical. Therefore, a wide variety of power reduction techniques have been proposed and realized, including Clock Gating, DVFS and Power Gating. To maximize the effectiveness of these techniques, task scheduling is a key but for multi-core systems it is very complicated due to the huge exploration space. This problem is a major obstacle for further power reduction. To cope with it, we propose a design method for embedded systems to minimize their energy consumption under performance constraints. This method is based on the clarification of properties of the above mentioned low power techniques and their interactions. In more details, we firstly establish energy models for these low power techniques and our target systems. We then explore for the best configuration by constructing an optimization problem especially for applications which have a longer deadline than the execution interval. Finally, we propose an approximate solution using dynamic programming with a lower computation complexity and compare it to a brute force explicit solution. We confirm with our evaluations that the proposed method successfully found a better configuration which reduces the total energy consumption by 32% if compared to the manually optimized configuration, which utilizes only one core., Information and Media Technologies Editorial Board, 出版日 2014年, Information and Media Technologies, 9巻, 4号, 掲載ページ 419-428, 1881-0896, 130004705277

Design Aid of Multi-core Embedded Systems with Energy Model
Nakada Takashi; Okamoto Kazuya; Komoda Toshiya; Miwa Shinobu; Sato Yohei; Ueki Hiroshi; Hayashikoshi Masanori; Shimizu Toru; Nakamura Hiroshi
Shifting to multi-core designs is so pervasive a trend to overcome the power wall and it is a necessary move for embedded systems in our rapidly evolving information society. Meanwhile, the need to increase the battery life and reduce maintenance costs for such embedded systems is very critical. Therefore, a wide variety of power reduction techniques have been proposed and realized, including Clock Gating, DVFS and Power Gating. To maximize the effectiveness of these techniques, task scheduling is a key but for multi-core systems it is very complicated due to the huge exploration space. This problem is a major obstacle for further power reduction. To cope with it, we propose a design method for embedded systems to minimize their energy consumption under performance constraints. This method is based on the clarification of properties of the above mentioned low power techniques and their interactions. In more details, we firstly establish energy models for these low power techniques and our target systems. We then explore for the best configuration by constructing an optimization problem especially for applications which have a longer deadline than the execution interval. Finally, we propose an approximate solution using dynamic programming with a lower computation complexity and compare it to a brute force explicit solution. We confirm with our evaluations that the proposed method successfully found a better configuration which reduces the total energy consumption by 32% if compared to the manually optimized configuration, which utilizes only one core., Information Processing Society of Japan, 出版日 2014年, IPSJ Online Transactions, 7巻, 0号, 掲載ページ 122-131, 1882-6660, 130004679148
DOI URL

SWoPP新潟2014開催報告
中島耕太; 勝康夫; 三輪忍; 高野了成; 岩下武史; 吉川隆英; 多田野寛人; 松谷宏紀
出版日 2014年, 情報処理, 55巻, 12号, 掲載ページ 1415-1418, 日本語, 記事・総説・解説・論説等（学術雑誌）

キャッシュ電源遮断時の性能ペナルティ削減のための損失データプリフェッチ
有間英志; 薦田登志矢; 中田尚; 三輪忍; 中村宏
現在のコンピュータシステムでは，プロセッサのアイドル時の電力を削減するために，OSがアイドル状態を検出するとコアやキャッシュの電源遮断が行われる．ただし，キャッシュの電源を遮断した場合には，格納されていたデータが失われるため，電源復帰後にそのような損失データを参照した場合，追加のキャッシュミスが発生して性能が低下するという問題がある．そのため，現行のシステムではキャッシュの電源遮断を行う機会は限られており，特にラスト・レベル・キャッシュの電源遮断はほとんど行われていないのが現状である．本稿では，このキャッシュの電源遮断にともなう性能低下を防ぐため，電源遮断によって損失した各々のデータについて，そのデータがアクセスされる前にキャッシュに復帰させるプリフェッチ方式を提案する．提案方式をシミュレータ上に実装し，実験を行った結果，電源遮断後にも再利用されるような損失データのうち，多くのデータについてプリフェッチが成功した．これにより電源遮断にともなう性能低下を大幅に抑えることができ，電源遮断の機会を広げることができることが分かった．In current computer systems, to reduce power consumption of a processor in idle state, cores and caches are powered off when OS detects the idle state. However, powering off caches causes performance degradation, because it invokes data loss and additional cache misses. For this reason, caches, especially last level cache, are infrequently powered off in modern systems. To cope with this problem we propose a novel prefetch scheme: restoring such lost data before they are re-referenced. The experimental results show lots of lost data can be restored before re-references. Hence, it is cleared that this method suppresses performance degradation and increases opportunity of powering off caches., 一般社団法人情報処理学会, 出版日 2013年09月25日, 情報処理学会論文誌コンピューティングシステム（ACS）, 6巻, 3号, 掲載ページ 118-130, 日本語, 1882-7829, 201502266912937258, 110009606665

周期実行システムにおける中間データに着目した電力制御手法
重松拓也; 薦田登志矢; 中田尚; 三輪忍; 佐藤洋平; 植木浩; 林越正紀; 清水徹; 中村宏
現在，様々な分野でスマートセンサシステムが使われている．しかし各ノードに十分な電源を確保することは難しく，電池で動作しなければならない状況で利用されることも多い．このような状況下では電池交換の回数を最小化したいといった要求があり，ノード自体の省電力化が強く求められている．特に，ノード内で高度な処理を行うセンサシステムではマイコンが消費する電力が問題となっている．従来より，マイコンの消費電力を抑えるためにパワーゲーティングと呼ばれる手法が用いられるが，近年ではワーキングメモリをもパワーゲーティングするより深いスリープモードを持つマイコンも登場している．深いスリープを行えば大幅な電力削減効果が得られるが，ワーキングメモリの内容が失われるため，復帰後も必要な中間データは不揮発メモリに退避させる必要がある．また，中間データの退避にも追加エネルギが必要であるため，深いスリープによって得られる消費エネルギの削減分より，この退避エネルギが大きくなる場合には深いスリープを行うべきではない．そこで本稿では，中間データのサイズと保持期間に着目し，マイコンが消費するエネルギを最小化する最適な電源制御とデータ退避方法を導出するアルゴリズムを提案する．, 一般社団法人情報処理学会, 出版日 2013年09月10日, 研究報告組込みシステム（EMB）, 2013巻, 5号, 掲載ページ 1-8, 日本語, 0919-6072, 201502272328977191, 110009605215

電力制約下におけるCPUとネットワークの電力制御協調手法
會田翔; 三輪忍; 中村宏
現在の大規模計算環境においては，実質的に利用可能な電力の限界が見えてきたことで性能向上のために省電力化が必要となっている．本研究は近年の高性能化により消費電力が無視できなくなってきたネットワークの省電力化に着目している．Energy Efficient Ethernet(EEE) はネットワークの省電力化技術として標準化されている．これはデータを送受信していない時にリンクを低電力モードに遷移させることで PHY の消費電力を減少させる技術である．本稿では，電力制約のある大規模計算環境において EEE が導入されることを想定し，ネットワークにおいて削減した電力を効率良く計算ノードの CPU に分配することで，アプリケーションの性能を向上させる手法を提案する．, 一般社団法人情報処理学会, 出版日 2013年07月24日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2013巻, 1号, 掲載ページ 1-8, 日本語, 201502224001728886, 110009588121, AN10463942
URL

ALUローテーションによるスーパスカラプロセッサの性能向上
井上聖等; 三輪忍; 中田尚; 中村宏
プロセッサの定格の電圧と動作周波数は，半導体素子が正常に動作することを保証するため，ジャンクション温度がしきい値を超えないように定められている．ジャンクション温度はホット・スポットのモジュールのアクティビティに依存するため，IPC を保ったままアクティビティを下げることができればより高い周波数を用いることができ，プロセッサ性能は向上する．ホット・スポットの 1 つである ALU は，通常の実装では ALU 間のアクティビティに大きな偏りが存在し，その結果，特定の ALU が高温になりやすい構造となっている．本稿では，多数の ALU を用意し，それらをラウンド・ロビンに利用することで，IPC を悪化させることなく個々の ALU のアクティビティを抑える手法を提案する．評価の結果，提案手法によって 10.4% 性能が向上することがわかった．, 出版日 2013年03月19日, 研究報告計算機アーキテクチャ（ARC）, 2013巻, 10号, 掲載ページ 1-8, 日本語, 110009552443

バイパス専用ALUを用いる事による小面積高スループットプロセッサ
齋藤和明; 三輪忍; 中條拓伯
出版日 2013年, 情報処理学会研究報告(CD-ROM), 2012巻, 5号, 2186-2583, 201302246094880398

ALUローテーションによるスーパスカラプロセッサの性能向上
井上聖等; 三輪忍; 中田尚; 中村宏
出版日 2013年, 情報処理学会研究報告(CD-ROM), 2012巻, 6号, 2186-2583, 201302270889884373

NoC型メニーコア設計のための高速キャッシュシミュレーション
中田尚; 三輪忍; 中村宏
出版日 2013年, 情報処理学会研究報告(CD-ROM), 2012巻, 5号, 2186-2583, 201302294688642815

編集にあたって
三輪忍
出版日 2013年, 情報処理, 54巻, 7号, 掲載ページ 652-653, 日本語, 記事・総説・解説・論説等（学術雑誌）

ノーマリーオフコンピューティング～期待と課題～
中村宏; 中田尚; 三輪忍
出版日 2013年, 情報処理, 54巻, 7号, 掲載ページ 654-660, 日本語, 記事・総説・解説・論説等（学術雑誌）, 0447-8053, 201302264272913384

FX10におけるインタコネクト・コントローラの省電力化手法の初期検討
三輪忍; 會田翔; 安島雄一郎; 清水俊幸; 安里彰; 中村宏
近年のスーパコンピュータでは，供給可能な電力がシステムの規模を決定づける主要因となってきている．供給可能な電力は現状の 2～3 倍程度が現実的な上限と考えられている．そのため，エクサフロップス級のシステム実現のためには，コンピュータのあらゆるモジュールにおいて電力効率のさらなる改善が必須である．本稿では，スーパコンピュータ FX10 を対象に，これまであまり研究の対象とされてこなかったインタコネクト部分の省電力化手法を検討する．, 出版日 2012年12月06日, 研究報告計算機アーキテクチャ（ARC）, 2012巻, 5号, 掲載ページ 1-10, 日本語, 2186-2583, 201302204333308109, 110009490616, AN10096105
URL

FX10におけるインタコネクト・コントローラの省電力化手法の初期検討
三輪忍; 會田翔; 安島雄一郎; 清水俊幸; 安里彰; 中村宏
近年のスーパコンピュータでは，供給可能な電力がシステムの規模を決定づける主要因となってきている．供給可能な電力は現状の 2～3 倍程度が現実的な上限と考えられている．そのため，エクサフロップス級のシステム実現のためには，コンピュータのあらゆるモジュールにおいて電力効率のさらなる改善が必須である．本稿では，スーパコンピュータ FX10 を対象に，これまであまり研究の対象とされてこなかったインタコネクト部分の省電力化手法を検討する．, 出版日 2012年12月06日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2012巻, 5号, 掲載ページ 1-10, 日本語, 110009490653, AN10463942
URL

バイパス専用ALUを用いる事による小面積高スループットプロセッサ
齋藤和明; 三輪忍; 中條拓伯
命令レベルの並列性 (ILP) を有効に利用するため，発行幅を大きくすることは有効である．しかし，発行幅を大きくするにあたって，非演算回路の回路面積や消費電力の増加といった問題が引き起こされる．我々は特にレジスタ・ファイルの回路面積増加を抑え，その上でスループットを向上させるために，直近の演算結果を提供するバイパス機構に着目し，レジスタ・ファイル・アクセスの制限された ALU であるバイパス専用 ALU を提案する．提案手法であるバイパス専用 ALU を適用した場合， ALU 2 個の構成に対し， SPEC CINT2006 ベンチマークセットにおいて，平均 8.0% のスループット向上， SPEC CFP2006 ベンチマークセットにおいて平均 5.7% のスループット向上であった．, 出版日 2012年12月06日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2012巻, 12号, 掲載ページ 1-6, 日本語, 110009490660, AN10463942
URL

NoC型メニーコア設計のための高速キャッシュシミュレーション
中田尚; 三輪忍; 中村宏
比較的小規模なコアを多数接続したメニーコアシステムは電力あたり性能に優れたシステムとして注目されている．特にコア間をオンチップネットワーク（Network on Chip: NoC）で接続した NoC 型メニーコアはコア数増大に適応可能なスケーラブルなメニーコアシステムであるといえる．しかし， NoC 型メニーコア設計においては設計パラメータが多岐にわたり，各パラメータを変えつつ，詳細なシミュレーションを行うためには膨大な時間が必要となり，効率的な設計の妨げになっている．そこで本研究では， NoC 型メニーコアの性能に与える影響が大きな共有キャッシュに注目し，そのシミュレーションをコア本体やネットワークのシミュレーションと分離する．これにより，共有キャッシュの挙動を高速にシミュレートし，性能予測を大幅に高速化することで，設計空間の大まかな絞り込みを実現する．, 出版日 2012年12月06日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2012巻, 15号, 掲載ページ 1-6, 日本語, 110009490663

Dalvikアクセラレータのハードウェア実装
吉實大輔; 太田淳; 三輪忍; 中條拓伯
出版日 2012年10月10日, 組込みシステムシンポジウム2012論文集, 2012巻, 掲載ページ 225-226, 日本語, 170000072445
URL

C-006 ユーザーの快適さを考慮した情報機器の動的電源制御(コンピュータシステム技術,C分野:ハードウェア・アーキテクチャ)
岩澤直弘; 薦田登志矢; 三輪忍; 中田尚; 中村宏
FIT(電子情報通信学会・情報処理学会)運営委員会, 出版日 2012年09月04日, 情報科学技術フォーラム講演論文集, 11巻, 1号, 掲載ページ 277-278, 日本語, 201202284513055620, 110009622702

周期実行システムにおける省電力スケジューリングの初期検討
岡本和也; 薦田登志矢; 中田尚; 三輪忍; 佐藤洋平; 植木浩; 林越正紀; 清水徹; 中村宏
マイクロプロセッサを備えたセンサであるスマートセンサは，周囲の状況を周期的にサンプリングし，センシングした結果に簡単な処理を施し，その結果をメインのシステムへ送信する，周期的リアルタイムシステムの一種である．ただし，一般的なリアルタイムシステムとは異なり，入力データのサンプリング周期とデータ送信（デッドライン）の周期が必ずしも一致するわけではなく，一般には，後者の周期が前者の周期よりもはるかに大きい．そのため，データの入力間隔に合わせてシステムがデータを処理するのではなく，データを一旦バッファに格納しておき，いくつかのデータがバッファに溜まったらシステムを起動して処理を行い，処理が完了したらシステムをシャットダウンする，という制御が可能である．このような制御を行えば， DVFS や動的電源制御などの従来の制御を行う場合よりも，省電力なシステムを実現できると考えられる．本稿では，上述の制御を行うシステムのモデルを提案し，既存の制御手法と比較する．評価の結果，既存手法と比べて消費エネルギを 79.6% 削減できることがわかった．, 出版日 2012年09月03日, 研究報告組込みシステム（EMB）, 2012巻, 4号, 掲載ページ 1-8, 日本語, 170000071971, AA12149313

CPU/GPU間データ通信向け先読み機構の検討
薦田登志矢; 三輪忍; 中村宏
HPC を中心として，GPU コンピューティングの重要性が高まっている．一般的な構成の GPU コンピューティングシステムでは，汎用 CPU と GPU が物理的に異なるメモリを持ちこれらがシステムバスを介して接続される．これまでシステムバスにおけるデータ転送オーバーヘッドは，プログラマがアプリケーションの特性を考慮しつつデータ転送処理を最適化することで対処されてきた．しかし，手動によるデータ通信の管理・最適化はアプリケーション開発の生産性を大きく低下させることから，このようなデータ転送処理の自動化・自動最適化が望まれている．そこで本研究では，システムメモリとグラフィクスメモリの間で生じるデータ転送を対象とし，自動で計算と転送の並列実行を実現する先読み機構を提案する．提案システムは，アプリケーションのデータ通信パターンを実行時に解析し，次に転送対象となるデータを予測する．予測対象データは，非同期転送を用いて計算処理の裏で GPU 上のメモリへと先読みされる．本稿ではこのような先読み機構の設計と実装を示し，初期評価実験の結果を通じて性能向上の可能性を検討する．, 出版日 2012年07月25日, 研究報告計算機アーキテクチャ（ARC）, 2012巻, 25号, 掲載ページ 1-8, 日本語, 110009425037, AN10096105
URL

アイドル時キャッシュ電源遮断における性能ペナルティ削減手法の実装
有間英志; 薦田登志矢; 三輪忍; 中村宏
プロセッサがアイドル時に消費するリーク電力が全消費電力に占める割合は，トランジスタの微細化が進むにつれて年々上昇を続け問題となっている．このようなリーク電力を削減する目的で，アイドル時に OS の判断によりコアへの電源供給を遮断するパワーゲーティング技術が広く用いられている．しかし，キャッシュの電源を遮断した場合には格納されていたデータが揮発するため，電源復帰後に失われたデータを参照した場合，それによるキャッシュミスが性能低下を引き起こす．そのため，本研究ではキャッシュの電源を遮断する場合においても，タグアレイには通電させておき，電源復帰後にタグを用いてデータを復帰させる技術を提案する．また，無駄なデータ復帰を防ぐため，再利用されるデータの識別手法についての検討を行い，予備的な評価を行う．, 出版日 2012年07月25日, 研究報告計算機アーキテクチャ（ARC）, 2012巻, 15号, 掲載ページ 1-7, 日本語, 110009425027, AN10096105
URL

レジスタ・ファイルと実行ユニットにおけるアクティビティ・マイグレーション
井上聖等; 三輪忍; 中田尚; 中村宏
近年のチップは，ホット・スポットから発せられる熱によって，安全に動作できる周波数が制限されてしまっている．よって，ホット・スポットの温度を下げることができれば，チップの動作周波数を向上させることができ，プロセッサ性能は向上する．アクティビティ・マイグレーションは，あるモジュールで行われる処理をそれと同等の機能を有する別のモジュールへと移すことで，性能を維持しつつモジュールの温度上昇を抑える技術である．本稿では，ホットなモジュールの 1 つであるレジスタ・ファイルと実行ユニットに関して，アクティビティ・マイグレーションの適用を検討する．, 出版日 2012年07月25日, 研究報告計算機アーキテクチャ（ARC）, 2012巻, 11号, 掲載ページ 1-9, 日本語, 110009425023

キャッシュの利用効率の向上に関する研究
浅見公輔; 倉田成己; 塩谷亮太; 三輪忍; 五島正裕; 坂井修一
マルチスレッド実行環境では，キャッシュが複数スレッドによって共有されるため，多くの競合が発生してプロセッサの性能が大きく低下する．共有キャッシュにおける競合を緩和し，キャッシュの利用効率を向上させる手法を研究した．, 出版日 2012年03月06日, 第74回全国大会講演論文集, 2012巻, 1号, 掲載ページ 61-62, 日本語, 201202216132290059, 170000089518, AN00349328
URL

情報機器の動的電源制御における起動時間隠蔽のためのリクエスト間隔予測手法
渡辺千洋; 三輪忍; 中村宏
個人用情報機器においては、消費エネルギーを削減するため個々のモジュールのアイドル時間を検出して電源を遮断する、動的電源制御が行われている。従来の動的電源制御では、電源遮断のタイミングのみに着目して研究が行われており、電源復帰時の起動時間については考慮されていない。従来手法では、電源が遮断されている状態でリクエストが到来したら起動を開始する、という単純な制御を行っている。モジュールによっては起動に数秒を要するものもあり、このような電源制御はユーザに対してストレスを与えていると考えられる。本稿では、統計的な手法を用いたリクエスト間のインターバル予測に基づく電源制御により、機器の再起動に要する遅延を隠蔽する手法を提案する。, 一般社団法人情報処理学会, 出版日 2012年03月06日, 全国大会講演論文集, 2012巻, 1号, 掲載ページ 67-69, 日本語, 201202299830951582, 110009784863, AN00349328
URL

アイドル時のキャッシュ電源遮断による性能ペナルティとその削減手法 (集積回路・集積回路とアーキテクチャの協創 : ノーマリオフコンピューティングによる低消費電力化への挑戦)
有間英志; 薦田登志矢; 三輪忍; 中村宏
プロセッサがアイドル時に消費するリーク電力が全消費電力に占める割合は,トランジスタの微細化が進むにつれて年々上昇を続け問題となっている.このようなリーク電力を削減する目的で,プロセッサアイドル時にコアへの電源供給を遮断するパワーゲーティング技術がモバイル向け・デスクトップ向けのプロセッサで広く用いられている.現行のシステムでは,CPUのアイドル時間が一定の閾値を越えた場合にコアへの電源遮断を制御しているが,このとき問題になるのがスリープモード中にキャッシュに存在するデータが揮発することによって生じるスリープ復帰後のキャッシュミスの増大である.本研究ではコアがスリープモードに入った場合に生じるキャッシュフラッシュの影響によるキャッシュミス増大を回避するための,キャッシュプリフェッチ手法を提案しその効果について予備的な評価を行う., 一般社団法人電子情報通信学会, 出版日 2012年01月19日, 電子情報通信学会技術研究報告 : 信学技報, 111巻, 388号, 掲載ページ 9-14, 日本語, 0913-5685, 201202294075288205, 110009481165, AN10013276
URL

データ保持性を利用したキャッシュのパワーゲーティング手法 (集積回路・集積回路とアーキテクチャの協創 : ノーマリオフコンピューティングによる低消費電力化への挑戦)
金均東; 武田清大; 三輪忍; 中村宏
Caches consume large amount of leakage power because of their large area and massive transistors. To handle leakage power of caches, several works using power-gating(PG) was proposed. Even though PG is capable of high leakage saving, energy overhead by dismissing data is a big shortcoming of PG. In this paper, we focus on the data retentiveness of PG. This nature was not focused on previous works. Voltage of SRAM cell does not decrease to zero immediately after PG and this phenomenon is valuable to relive energy overhead for data recovery. We also propose a circuit to utilize data retentiveness. With the oracle knowledge control, we examined leakage saving potential of our proposal for L1 instruction and data cache. Results show that utilizing retentiveness of PG have big potential of leakage saving., 一般社団法人電子情報通信学会, 出版日 2012年01月19日, 電子情報通信学会技術研究報告 : 信学技報, 111巻, 388号, 掲載ページ 1-7, 英語, 0913-5685, 110009481164, AN10013276
URL

データ保持性を利用したキャッシュのパワーゲーティング手法
金均東; 武田清大; 三輪忍; 中村宏
Caches consume large amount of leakage power because of their large area and massive transistors. To handle leakage power of caches, several works using power-gating(PG) was proposed . Even though PG is capable of high leakage saving, energy overhead by dismissing data is a big shortcoming of PG. In this paper, we focus on the data retentiveness of PG. This nature was not focused on previous works. Voltage of SRAM cell does not decrease to zero immediately after PG and this phenomenon is valuable to relive energy overhead for data recovery. We also propose a circuit to utilize data retentiveness. With the oracle knowledge control, we examined leakage saving potential of our proposal for L1 instruction and data cache. Results show that utilizing retentiveness of PG have big potential of leakage saving.Caches consume large amount of leakage power because of their large area and massive transistors. To handle leakage power of caches, several works using power-gating(PG) was proposed . Even though PG is capable of high leakage saving, energy overhead by dismissing data is a big shortcoming of PG. In this paper, we focus on the data retentiveness of PG. This nature was not focused on previous works. Voltage of SRAM cell does not decrease to zero immediately after PG and this phenomenon is valuable to relive energy overhead for data recovery. We also propose a circuit to utilize data retentiveness. With the oracle knowledge control, we examined leakage saving potential of our proposal for L1 instruction and data cache. Results show that utilizing retentiveness of PG have big potential of leakage saving., 出版日 2012年01月12日, 研究報告計算機アーキテクチャ（ARC）, 2012巻, 1号, 掲載ページ 1-7, 英語, 170000068914, AN10096105
URL

アイドル時のキャッシュ電源遮断による性能ペナルティとその削減手法
有間英志; 薦田登志矢; 三輪忍; 中村宏
プロセッサがアイドル時に消費するリーク電力が全消費電力に占める割合は，トランジスタの微細化が進むにつれて年々上昇を続け問題となっている．このようなリーク電力を削減する目的で，プロセッサアイドル時にコアへの電源供給を遮断するパワーゲーティング技術がモバイル向け・デスクトップ向けのプロセッサで広く用いられている．現行のシステムでは，CPU のアイドル時間が一定の閾値を越えた場合にコアへの電源遮断を制御しているが，このとき問題になるのがスリープモード中にキャッシュに存在するデータが揮発することによって生じるスリープ復帰後のキャッシュミスの増大である．本研究ではコアがスリープモードに入った場合に生じるキャッシュフラッシュの影響によるキャッシュミス増大を回避するための，キャッシュプリフェッチ手法を提案しその効果について予備的な評価を行う．, 出版日 2012年01月12日, 研究報告計算機アーキテクチャ（ARC）, 2012巻, 2号, 掲載ページ 1-6, 日本語, 170000068915, AN10096105
URL

CPU/GPU間データ通信向け先読み機構の検討
薦田登志矢; 三輪忍; 中村宏
出版日 2012年, 情報処理学会研究報告(CD-ROM), 2012巻, 3号, 2186-2583, 201202222965513124

アイドル時キャッシュ電源遮断における性能ペナルティ削減手法の実装
有間英志; 薦田登志矢; 三輪忍; 中村宏
出版日 2012年, 情報処理学会研究報告(CD-ROM), 2012巻, 3号, 2186-2583, 201202239811755060

レジスタ・ファイルと実行ユニットにおけるアクティビティ・マイグレーション
井上聖等; 三輪忍; 中田尚; 中村宏
出版日 2012年, 情報処理学会研究報告(CD-ROM), 2012巻, 3号, 2186-2583, 201202268784259536

CMPにおけるキャッシュ・データを考慮したスレッド・スケジューリング手法の初期検討
三輪忍; 角崎宏一; 角崎宏一; 佐々木広; 中村宏
出版日 2012年, 情報処理学会研究報告(CD-ROM), 2012巻, 1号, 2186-2583, 201202239918739068

OSの電力管理下におけるラスト・レベル・キャッシュのリーク削減手法の比較
有間英志; 薦田登志矢; 三輪忍
出版日 2012年, 回路とシステムワークショップ論文集(CD-ROM), 25巻, 202102243559229090

命令グループのワーキング・セットに着目したキャッシュ・マネジメント
浅見公輔; 倉田成己; 塩谷亮太; 三輪忍; 五島正裕; 坂井修一
出版日 2012年, 情報処理学会研究報告(CD-ROM), 2012巻, 1号, 2186-2583, 201202203624989886

命令グループごとのキャッシュ・パーティショニングの予備評価
浅見公輔; 倉田成己; 塩谷亮太; 三輪忍; 五島正裕; 坂井修一
出版日 2012年, 情報処理学会研究報告(CD-ROM), 2012巻, 3号, 2186-2583, 201202247876844837

周期実行システムにおける省電力スケジューリングの初期検討
岡本和也; 薦田登志矢; 中田尚; 三輪忍; 佐藤洋平; 植木浩; 林越正紀; 清水徹; 中村宏
出版日 2012年, 情報処理学会研究報告(CD-ROM), 2012巻, 3号, 2186-2583, 201202224576054281

スリープ深度制御による動作時リーク電力削減(ポスター講演,ポスターセッション,学生・若手技術者育成のための研究会)
武田清大; 三輪忍; 中村宏
一般社団法人電子情報通信学会, 出版日 2011年12月08日, 電子情報通信学会技術研究報告. ICD, 集積回路, 111巻, 352号, 掲載ページ 69-69, 日本語, 110009466843, AN10013276

メニーコアプロセッサにおける競合とスケーラビリティを考慮したスレッドスケジューリング
谷本輝夫; 佐々木広; 三輪忍; 中村宏
本研究はメニーコアシステム上で並列アプリケーションを複数同時に実行した際のシステム全体の性能向上を目指す。メニーコアシステムではキャッシュやメモリなどの資源を複数のコアで共有しているため，アプリケーション間の競合を防ぐことが重要である．また，アプリケーション毎にスケーラビリティが異なるため、複数のアプリケーションを同時に実行する際にはスケーラビリティに応じて適切に資源を分配することが望ましい。本研究では同時に実行されるアプリケーションに割り当てるコア数を動的に制御することで効率的に実行する。本稿ではアプリケーションの振る舞いが一定であるという仮定のもとで実際にスケジューラを実装し，実行時情報からスケーラビリティを検出し，適切な割り当てコア数を決定できることを示す．, 出版日 2011年11月21日, 研究報告計算機アーキテクチャ（ARC）, 2011巻, 31号, 掲載ページ 1-7, 日本語, 2186-2583, 201202275944812179, 110008713501, AN10096105
URL

メニーコアプロセッサにおける競合とスケーラビリティを考慮したスレッドスケジューリング
谷本輝夫; 佐々木広; 三輪忍; 中村宏
本研究はメニーコアシステム上で並列アプリケーションを複数同時に実行した際のシステム全体の性能向上を目指す。メニーコアシステムではキャッシュやメモリなどの資源を複数のコアで共有しているため，アプリケーション間の競合を防ぐことが重要である．また，アプリケーション毎にスケーラビリティが異なるため、複数のアプリケーションを同時に実行する際にはスケーラビリティに応じて適切に資源を分配することが望ましい。本研究では同時に実行されるアプリケーションに割り当てるコア数を動的に制御することで効率的に実行する。本稿ではアプリケーションの振る舞いが一定であるという仮定のもとで実際にスケジューラを実装し，実行時情報からスケーラビリティを検出し，適切な割り当てコア数を決定できることを示す．, 出版日 2011年11月21日, 研究報告ハイパフォーマンスコンピューティング（HPC）, 2011巻, 31号, 掲載ページ 1-7, 日本語, 110008713537, AN10463942
URL

OpenCLを用いたパイプライン並列プログラミングAPIの初期検討
薦田登志矢; 三輪忍; 中村宏
シングルスレッド性能向上の限界，電力制約の問題から特定アプリケーションに特化したアクセラレータを利用することの重要性が高まっている．これまでのアクセラレータを利用する事例はデータ並列性を利用するアプリケーションを主たるターゲットとしてきた．しかし，特に組み込みシステムにおいてパイプライン並列性を利用することがアプリケーションの性能向上を，与えられた電力制約のもと達成するために重要となる．本稿では組み込みシステムにおいてアクセラレータを利用する場面を想定し，アクセラレータを含むシステム上でパイプライン並列性を利用するアプリケーションを容易にかつ柔軟に実現するためのライブラリを提案する．提案ライブラリではアクセラレータプログラミングの標準として策定された OpenCL を用い，ソフトウェアパイプライニング技術を応用することで，アクセラレータ上におけるパイプライン並列処理を実現すると同時に，パイプライン並列アプリケーションを開発するための簡潔なユーザーインタフェースを提供する．プロトタイプシステムの評価により，パイプライン並列処理におけるタスクスケジューリングや通信バッファの管理といったシステムの複雑さをプログラマから隠蔽しつつ，アクセラレータデバイス上においてパイプライン化による性能向上を達成できることが分かった．, 出版日 2011年11月21日, 研究報告計算機アーキテクチャ（ARC）, 2011巻, 10号, 掲載ページ 1-7, 日本語, 110008713480, AN10096105
URL

データ符号化によるラスト・レベル・キャッシュの回路面積削減
横山弘基; 堀部悠平; 三輪忍; 中條拓伯
出版日 2011年, 情報処理学会研究報告(CD-ROM), 2010巻, 6号, 2186-2583, 201102267115554260

Android端末におけるハードウェアによるJavaの高速化手法の提案
太田淳; 三輪忍; 中條拓伯
出版日 2011年, 情報処理学会論文誌トランザクション(CD-ROM), 2011巻, 1号, 1882-7772, 201102227683431006

OpenCLを用いたパイプライン並列プログラミングAPIの初期検討
薦田登志矢; 三輪忍; 中村宏
出版日 2011年, 情報処理学会研究報告(CD-ROM), 2011巻, 4号, 2186-2583, 201202257832830168

キャッシュデータをマイグレーションするCMPにおけるスレッドマイグレーション
角崎宏一; 佐々木広; 三輪忍; 中村宏
出版日 2011年, 電子情報通信学会技術研究報告, 111巻, 255(CPSY2011 25-41)号, 0913-5685, 201102217639090492

ロード/ストアの命令アドレスによる選択的キャッシュ・ライン・アロケーション
堀部悠平; 三輪忍; 塩谷亮太; 五島正裕; 中條拓伯
出版日 2011年, 先進的計算基盤システムシンポジウム SACSIS 2011, 2011巻, 掲載ページ 316-323-323, 日本語, 査読付, 研究発表ペーパー・要旨（全国大会，その他学術会議）, 170000065684
URL

キャッシュを用いたレジスタ・マップ表の回路面積削減
三輪忍; ZHANG Peng; 横山弘基; 堀部悠平; 中條拓伯
出版日 2010年, 情報処理学会論文誌トランザクション(CD-ROM), 2010巻, 1号, 1882-7772, 201102283679932405

SMTプロセッサにおけるL1/L2キャッシュアクセス動的切替え方式
小笠原嘉泰; 小笠原嘉泰; 三輪忍; 中條拓伯
出版日 2009年, 情報処理学会論文誌トランザクション(CD-ROM), 2009巻, 1号, 1882-7772, 200902227901550197

並列/分散処理環境における組込み仮想マシンの実現可能性
矢野裕章; 中西正樹; 三輪忍; 中條拓伯
出版日 2009年, 情報処理学会研究報告, ARC-181巻, 1(ARC-181 EMB-11)号, 掲載ページ 75-80, 0919-6072, 200902202864117507

スケジュールド命令キャッシュを用いた高速な命令供給手法
三輪忍; 中條拓伯
出版日 2009年, 情報処理学会研究報告 ARC-185, 2009巻, 4号, 掲載ページ -, 2186-2583, 201002287475800281

メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法
堀部悠平; 張鵬; 小笠原嘉泰; 三輪忍; 中條拓伯
出版日 2009年, 情報処理学会研究報告 ARC-182/HPC-119 (HOKKE 2009), 2009巻, 14(ARC-182 HPC-119)号, 掲載ページ 91-96, 0919-6072, 200902292430255005

スケーラブルFPGAシステムにおけるハードウェア拡張プロトコル
中條拓伯; 坂本龍一; 三輪忍
出版日 2009年, 信学技報(リコンフィギャラブルシステム研究会（RECONF）, 12/2-4巻, 掲載ページ -

ＡＬＵＣａｓｃａｄｉｎｇのための動的命令スケジューラ
尾形幸亮; YAO Jun; 嶋田創; 三輪忍; 富田眞治
出版日 2008年06月04日, 情報処理学会シンポジウム論文集, 2008巻, 5号, 掲載ページ 105-114, 日本語, 査読付, 1344-0640, 200902244074006750

コンテキスト・ベース値予測を利用した分岐先予測器
平嶋哲朗; 嶋田創; 三輪忍; 富田眞治
出版日 2008年, 情報処理学会研究報告, 2008巻, 39(ARC-178)号, 0919-6072, 200902269397485162

並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装
川原崇宏; 三輪忍; 嶋田創; 森眞一郎; 富田眞治
出版日 2008年, 情報処理学会研究報告, 2008巻, 2(SLDM-133)号, 0919-6072, 200902255895102350

圧縮されたパス情報を用いた分岐予測手法
三輪忍; 中條拓伯
出版日 2008年, 情報処理学会シンポジウム論文集, 2008巻, 5号, 1344-0640, 200902226911654601

FPGAにおけるマルチSMTプロセッサの実装
小笠原嘉泰; 館一平; 三輪忍; 中條拓伯
出版日 2008年, 先進的計算基盤システムシンポジウムSACSIS (Symposium on Advanced Computing Systems and Infrastructures) 2008 論文集, Vol.2008巻, No.6号, 1344-0640, 200902273969894830

小容量ＲＡＭを用いたオペランド・バイパスの複雑さの低減手法
三輪忍; 一林宏憲; 入江英嗣; 五島正裕; 富田眞治
出版日 2007年05月23日, 情報処理学会シンポジウム論文集, 2007巻, 5号, 掲載ページ 265-274, 日本語, 査読付, 1344-0640, 200902213975140356

インタラクティブシミュレーションにおける遠隔操作フレームワークの実装
橋本健介; 嶋田創; 三輪忍; 幡生安紀; 森眞一郎; 富田眞治
出版日 2007年, 情報処理学会研究報告, 2007巻, 80(HPC-111)号, 0919-6072, 200902204555660347

ALU Cascadingを行う動的命令スケジューラ
尾形幸亮; YAO Jun; 三輪忍; 嶋田創; 富田眞治
出版日 2007年, 情報処理学会研究報告, 2007巻, 55(ARC-173)号, 0919-6072, 200902227880794228

インタラクティブ流体シミュレータにおける力覚提示モデルに関する検討
山口明徳; 三輪忍; 嶋田創; 森眞一郎; 富田眞治
出版日 2007年, 日本バーチャルリアリティ学会大会論文集(CD-ROM), 12th巻, 1349-5062, 200902260859137265

故障に対してユーザ側の耐性を高めるデジタル家電アーキテクチャ
嶋田創; 三輪忍; 富田眞治
出版日 2007年, 情報処理学会研究報告, 2007巻, 115(ARC-175)号, 0919-6072, 200902284704258100

操作の連続性を考慮した手術シミュレータの高速化手法
依藤逸; 野田裕介; 吉田智一; 三輪忍; 粂直人; 嶋田創; 中尾恵; 森眞一郎; 富田眞治
出版日 2007年, 情報処理学会研究報告, 2007巻, 80(HPC-111)号, 0919-6072, 200902287963359704

ビット・ベクタを利用した選択的命令再発行機構
嶋田創; 三輪忍; 富田眞治
出版日 2007年, 情報処理学会研究報告, 2007巻, 79(ARC-174)号, 0919-6072, 200902291575945585

PCクラスタを用いた手術シミュレータにおける手術手技の連続性を考慮した高速化
野田裕介; 依藤逸; 三輪忍; 粂直人; 嶋田創; 森眞一郎; 富田眞治
出版日 2007年, 日本バーチャルリアリティ学会大会論文集(CD-ROM), 12th巻, 1349-5062, 200902248719470711

スラック予測を用いたクラスタ型スーパースカラ・プロセッサ向け命令ステアリング
福山智久; 三輪忍; 嶋田創; 五島正裕; 中島康彦; 森眞一郎; 富田眞治
我々は、命令のスラック（slack）に基づくクリティカリティ予測を提案している。ある命令の実行を s サイクル遅らせてもプログラムの実行時間が増大しないとき、s の最大値をその命令のスラックという。前回の実行時のスラックを予測表に登録しておくことによって、それを今回の予測値とすることができる。本稿では、スラック予測をクラスタ型スーパースカラ・プロセッサのステアリングに応用する方法を提案する。各命令の実行後に得られるスラックの値によって、その命令が次回実行時に使用するクラスタを決定する。シミュレーションによる評価の結果、発行幅が４のプロセッサを２つのクラスタに分割した場合、クラスタ化されていないプロセッサに比べ約１０％IPCが低下することが分かった。We proposed an instruction criticality prediction technique based on prediction of instruction slacks. When the execution time of a program doesn't become longer even if an instruction of the program is delayed by s cycles, the maximum of s is referred to as the slack of the instruction. The slack value is stored to the prediction table to be a predicted value for the next time. This paper describes instruction steering of clustered processor with slack prediction. The cluster that a instruction will use at the next time is decided by the slack value given after the execution of the instruction. Evaluation result shows IPC is reduced 10% in comparison with non-clustered processor., 一般社団法人情報処理学会, 出版日 2006年07月31日, 情報処理学会研究報告, 2006巻, 88(ARC-169)号, 掲載ページ 55-60, 日本語, 0919-6072, 200902293690458127, 110004824128, AN10096105
URL

パス情報を用いた分岐フィルタ機構
三輪忍; 福山智久; 嶋田創; 五島正裕; 中島康彦; 森眞一郎; 富田眞治
出版日 2006年05月22日, 情報処理学会シンポジウム論文集, 2006巻, 5号, 掲載ページ 315-323, 日本語, 1344-0640, 200902213821786547
URL

中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
吉村知晋; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
現在我々の研究室では,人間の視覚・触覚を通した実時間インタラクションを考慮にいれた超高速体感型シミュレーションシステムScubeの開発を行っている.Scubeのノード間ネットワークは,実時間数値シミュレーションとシミュレーション結果の可視化処理の両方で共有する形態をとる.Scubeを構築するにあたり,比較的小規模なギガビットイーサーネット・スイッチの組合せで,高いコストパフォーマンスを実現する中規模コモディティクラスタ向け相互結合網Three Quadsを提案した.Three Quadsは,ベース-m 3-キューブの拡張と考えると理解しやすい.ベース-m 3-キューブが3次元方向の同一座標軸上にのみリンクをもつのに対し,Three Quadsは3つの同一平面上の全ノードと結合している.多様な網の埋め込みが可能であり,ランダムな通信要求が発生した場合など,柔軟なネットワークリソースの提供が可能である.3次元の隣接開通信と共に,数値計算で多用される行列の転置処理のための全対全通信,並列画像合成処理における3次元Reduction型の通信等に対して優れた特性をもつ相互結合網である., 社団法人情報処理学会, 出版日 2006年02月27日, 情報処理学会研究報告. 計算機アーキテクチャ研究会報告, 2006巻, 20号, 掲載ページ 79-84, 日本語, 0919-6072, 200902209877159815, 110004668755, AN10096105
URL

DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
岡村大; 野田祐介; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
近年の計算機処理能力の急速な向上の中で注目を浴びる可視化方法の一つとして, ボリュームレンダリングが挙げられる.本稿では, 従来提案してきたVisAのボリュームデータ三重化の欠点を克服した大規模データの並列ボリュームレンダリングを行うシステムについて紹介する.ハードウェア実装向けのレイ・キャスティング法の工夫とDVIインタフェースを用いた超高速通信路により, 高レスポンス, 高フレームレートを実現する., 社団法人情報処理学会, 出版日 2006年01月17日, 情報処理学会研究報告. SLDM, [システムLSI設計技術], 2006巻, 4号, 掲載ページ 97-100, 日本語, 0919-6072, 110004085803

DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング
岡村大; 野田祐介; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
近年の計算機処理能力の急速な向上の中で注目を浴びる可視化方法の一つとして, ボリュームレンダリングが挙げられる.本稿では, 従来提案してきたVisAのボリュームデータ三重化の欠点を克服した大規模データの並列ボリュームレンダリングを行うシステムについて紹介する.ハードウェア実装向けのレイ・キャスティング法の工夫とDVIインタフェースを用いた超高速通信路により, 高レスポンス, 高フレームレートを実現する., 一般社団法人電子情報通信学会, 出版日 2006年01月11日, 電子情報通信学会技術研究報告. CPSY, コンピュータシステム, 105巻, 516号, 掲載ページ 97-100, 日本語, 0913-5685, 200902214626444360, 110004079428, AN10013141
URL

DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
岡村大; 野田祐介; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
近年の計算機処理能力の急速な向上の中で注目を浴びる可視化方法の一つとして, ボリュームレンダリングが挙げられる.本稿では, 従来提案してきたVisAのボリュームデータ三重化の欠点を克服した大規模データの並列ボリュームレンダリングを行うシステムについて紹介する.ハードウェア実装向けのレイ・キャスティング法の工夫とDVIインタフェースを用いた超高速通信路により, 高レスポンス, 高フレームレートを実現する., 社団法人電子情報通信学会, 出版日 2006年01月11日, 電子情報通信学会技術研究報告. RECONF, リコンフィギャラブルシステム, 105巻, 518号, 掲載ページ 43-46, 日本語, 0913-5685, 10017974718

汎用GPUを用いた流体シミュレーションのプロトタイプ実装
橋本健介; 小松原誠; 嶋田創; 三輪忍; 幡生安紀; 森眞一郎; 富田眞治
出版日 2006年, 電気関係学会北陸支部連合大会講演論文集(CD-ROM), 2006巻, 200902245307902383

並列ボリュームレンダリングにおける投機的描画に関する考察(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
篠本雄基; 三輪忍; 嶋田創; 森眞一郎; 中島康彦; 富田眞治
本稿では, 汎用GPUを用いた並列ボリュームレンダリングにおける問題点を指摘する.GPUによるレンダリングとCPUによる画像合成は互いに独立した処理であるため, パイプライン処理が可能であるが, 観察視点の指定間隔がレンダリング時間よりも長い場合, パイプラインに空きが生じる.このパイプラインの空きを利用した投機的描画について考察する., 社団法人情報処理学会, 出版日 2005年08月03日, 情報処理学会研究報告. 計算機アーキテクチャ研究会報告, 2005巻, 80号, 掲載ページ 145-150, 日本語, 0919-6072, 200902292094461858, 110002775587, AN10096105

スラック予測を用いた省電力アーキテクチャ向け命令スケジューリング
福山智久; 福田匡則; 三輪忍; 小西将人; 五島正裕; 中島康彦; 森真一郎; 富田真治
出版日 2005年05月18日, 情報処理学会シンポジウム論文集, 2005巻, 5号, 掲載ページ 123-132, 日本語, 1344-0640, 200902220147223775
URL

学習による非同期連続状態機械の構成
津田晃寿; 永野貴宣; 三輪忍; 津邑公暁; 五島正裕; 富田眞治
Recurrent Neural Networkは時系列情報を処理することができ,GSMと呼ばれる能力の高い言語モデルを提供する。しかし,時間連続な状態空間において時間連続な状態遷移を行うようにRNNを学習させることは,一般に困難である。そこで我々は,BPTTに基づく学習により,RNNでこの時間連続なGSMを実現する方法を提案する。実際に,連続的に変化する入力信号に対しモジュロカウンタとして動作するRNNを構築した。モデルには,RNNの出力から入力に遅延枝を追加して拡張したものを用いた。また,時間連続な状態空間にEBPTT学習アルゴリズムを適用するため,教師信号を定義しない時間を設けた。, 一般社団法人電子情報通信学会, 出版日 2002年08月16日, 電子情報通信学会技術研究報告. CPSY, コンピュータシステム, 102巻, 276号, 掲載ページ 59-64, 日本語, 0913-5685, 200902163414086169, 110003494006, AN10013141
URL

コンダクタンスニューロンモデルを用いた順序回路の実現
津田晃寿; 三輪忍; 津邑公暁; 五島正裕; 富田眞治
連続状態機械(GSM)はRecurrent Neural Network(RNN)で実現される。RNNは一般に形式ニューロン・モデルによって実装されている。しかし、形式ニューロン・モデルは時系列情報を扱うことができない。そのためにRNNは厳密には時間連続ではない。そこで、本論文では、まず本当に時系列情報を扱うことができるニューロンモデルを探すために、従来提案されてきた種々のニューロンモデルを比較し、膜電位に基づくニューロン・モデルには問題があることを示した。そこで次に、コンダクタンスに基づく新しいニューロン・モデルを提案した。さらに、そのモデルにより論理ゲートを設計し、順序回路を実装した。この回路は時間入力の変化に応じて時間連続に動作する。, 一般社団法人電子情報通信学会, 出版日 2001年07月18日, 電子情報通信学会技術研究報告. CPSY, コンピュータシステム, 101巻, 216号, 掲載ページ 31-38, 日本語, 0913-5685, 200902156871845346, 110003180648, AN10013141
URL

コンダクタンスニューラルネットにおけるGSMの構成
三輪忍; 津田晃寿; 津邑公暁; 五島正裕; 富田眞治
回帰結合をもつニューラルネットであるRNNは, 時系列データの処理を行うことができる.このようなマシンクラスはGSMと呼ばれ, 自然言語の処理に代表される人間の高次情報処理に十分な能力を持つ可能性があると考えられている.一般的なRNNでは形式ニューロンモデルを用いているが, このモデルは個々のニューロンの時間発展過程を無視している.従来この時系列情報の取り扱いがRNN自体に限界を与えていると考え, 我々は, 時間連続な状態空間と状態遷移をもつGSMを提案した.コンダクタンスモデルは現実のニューロンを忠実にモデリングしたものであり, パルスの時系列を入出力とする.このモデルによるRNNで, そのようなGSMが実現できることを示す., 一般社団法人電子情報通信学会, 出版日 2001年07月18日, 電子情報通信学会技術研究報告. CPSY, コンピュータシステム, 101巻, 216号, 掲載ページ 39-46, 日本語, 0913-5685, 200902153184407208, 110003180649, AN10013141
URL

書籍等出版物

ロス・キニー論理回路
佐藤証; 三輪忍; 吉永努
教科書・概説・概論, 日本語, 共訳, 東京化学同人, 出版日 2021年

Advanced Software Technologies for Post-Peta Scale Computing～The Japanese Post-Peta CREST Research Project～
M. Kondo; I. Miyoshi; K. Inoue; S. Miwa
学術書, 英語, 分担執筆, Power Management Framework for Post-Petascale Supercomputers, Springer, 出版日 2018年

コンピュータ・システム～プログラマの視点から
教科書・概説・概論, 日本語, 分担執筆, 6.5-6.7節, 9.1-9.7節の翻訳, 丸善出版, 出版日 2018年

IT研究者のひらめき本棚～ビブリオ・トーク：私のオススメ
一般書・啓蒙書, 日本語, 分担執筆, 近代科学社, 出版日 2017年

講演・口頭発表等

Design Challenges of CNFET Processors
S. Miwa
口頭発表（招待・特別）, ARCHIDE: Workshop on Architecture Design Methodologies and Ecosystems for HPC and Scientific Edge Computing, 招待
発表日 2024年08月

高帯域幅メモリを有するプロセッサにおけるデータプリフェッチャの性能分析
滕林; 三輪忍; 塩谷亮太; 八巻隼人; 本多弘樹
口頭発表（一般）, 情報処理学会ARC研究会
発表日 2023年08月

マルチパスルーティングにおけるINTを応用した帯域要求量ベースの動的トラフィック分散
佐藤翔; 荒巻慎太郎; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 情報処理学会IOT研究会
発表日 2023年07月

IP網におけるIn-networkコンテンツキャッシュ
大河原幸哉; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 情報処理学会IOT研究会
発表日 2023年07月

検査対象の種類ごとに特化したSnortを複数用いたソフトウェア侵入検知システムの並列化
小倉快将; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 情報処理学会ARC研究会
発表日 2023年05月

処理性能の異なる機器を複数台用いた並列NIDSに対するロードバランサ
八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 電子情報通信学会CPSY研究会
発表日 2023年05月

CNFET7: An Open Source Cell Library for 7-nm CNFET Technology
C. Shi, S. Miwa, T. Yang, R. Shioya, H. Yamaki, H. Honda
口頭発表（一般）, 日本語, 電子情報通信学会VLD研究会
発表日 2023年03月02日

ソフトウェアベース電力サイドチャネル攻撃の対抗策の評価
下島航太,三輪忍,八巻隼人,本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会CPSY研究会
発表日 2023年03月
開催期間 2023年

複数パターン長を有するマルチパターンマッチングにおけるラビン-カープ法のハッシュ関数最適化
鈴木想生,八巻隼人,三輪忍,本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会CPSY研究会
発表日 2023年03月
開催期間 2023年

GPUサーバにおける画像認識を行う深層学習の性能モデリング
松下哲也,三輪忍,八巻隼人,本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会CPSY研究会
発表日 2023年03月
開催期間 2023年

リンク集約におけるトラフィック負荷分散方式の検討
平野愁也,八巻隼人,三輪忍,本多弘樹
口頭発表（一般）, 日本語, 第244回ARC研究会
発表日 2023年03月
開催期間 2023年

並列アプリケーションのキャッシュミス数予測の評価
長谷川健人,有馬海人,三輪忍,八巻隼人,本多弘樹
口頭発表（一般）, 日本語, 第188回HPC研究会
発表日 2023年03月
開催期間 2023年

A64FXプロセッサにおける電力・性能ばらつきの評価・分析
草場智也,吉田幸平,三輪忍,八巻隼人,本多弘樹
口頭発表（一般）, 日本語, 第188回HPC研究会
発表日 2023年03月
開催期間 2023年

実HPCアプリケーションを用いたマルチGPUにおける電力ばらつきの評価
郡司賢,吉田幸平,三輪忍,八巻隼人,本多弘樹
口頭発表（一般）, 日本語, 第188回HPC研究会
発表日 2023年03月
開催期間 2023年

最長一致検索に対応する非TCAMキャッシュによるルータ宛先検索の高速化・省電力化
長田大樹,八巻隼人,三輪忍,本多弘樹,五島正裕
口頭発表（一般）, 日本語, 第244回ARC研究会
発表日 2023年03月
開催期間 2023年

SRAM の電力/遅延シミュレータCACTIのCNFETへの対応
関川栄一郎; 三輪忍; ヨウドウキン; 塩谷亮太; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第241回ARC研究会, 国内会議
発表日 2022年07月

CPUおよびGPUの電力ばらつきを考慮したジョブスケジューリング手法の提案
小野賢人; 吉田幸平; 三輪忍; 坂本龍一; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第185回HPC研究会, 国内会議
発表日 2022年07月

In-band Network Telemetryによるリンク混雑度に応じたマルチパス経路制御
荒巻慎太朗; 田中京介; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会NS研究会, 国内会議
発表日 2022年05月

Evaluation of Microprocessors Placed-and-Routed with CNFET
C. Shi; K. Sasaki; S. Miwa; T. Yang; R. Shioya; H. Yamaki; H. Honda
口頭発表（一般）, 日本語, 第240回ARC研究会, 国内会議
発表日 2022年03月

CUDAバージョンの違いがカーネルの実行時間と消費電力に与える影響の分析
吉田幸平; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第183回HPC研究会, 国内会議
発表日 2022年03月

マルウェア解析のための高速かつ安全なVMI機構
森瑞穂; 味曽野雅史; 八巻隼人; 三輪忍; 本多弘樹; 品川高廣
口頭発表（一般）, 日本語, コンピュータシステム・シンポジウム (ComSys'21),, 国内会議
発表日 2021年

Wisteria/BDEC-01におけるNVIDIA A100 GPUの電力性能ばらつきの評価
提山春日; 吉田幸平; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第182回HPC研究会, 国内会議
発表日 2021年

深層学習における実行時ファイルステージング
樋口遼太郎; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第182回HPC研究会, 国内会議
発表日 2021年

MPIにおける小規模実行時の通信トレース解析による大規模実行時の通信タイミング予測の評価
岡田悠希; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第182回HPC研究会, 国内会議
発表日 2021年

テーブル分離パケット処理キャッシュを用いたルータテーブル検索の高効率化
長田大樹; 田中京介; 八巻隼人; 三輪忍; 本多弘樹; 五島正裕
口頭発表（一般）, 日本語, The 5th cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG2021), 国内会議
発表日 2021年

カーボンナノチューブトランジスタを用いて論理合成したプロセッサの電力／面積／回路遅延評価
佐々木魁; 三輪忍; ヨウドウキン; 塩谷亮太; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第237回ARC研究会, 国内会議
発表日 2021年

MPIアプリケーションの関数コール回数予測
有馬海人; 長谷川健人; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第178回HPC研究会, 国内会議
発表日 2021年

MPIアプリケーションのキャッシュプロファイル予測
長谷川健人; 有馬海人; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第178回HPC研究会, 国内会議
発表日 2021年

TensorFlowアプリケーション用GPUサーバにおけるNVDIMMの利用可能性の検討
松下哲也; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第236回ARC研究会, 国内会議
発表日 2021年

Mesh TensorFlowを用いたモデル並列学習におけるCPU-GPU間のデータ転送最適化
横手宥則; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会CPSY研究会, 国内会議
発表日 2021年

Routing/ARP/ACL/QoSごとのテーブル分離パケット処理キャッシュ
長田大樹; 田中京介; 八巻隼人; 三輪忍; 本多弘樹; 五島正裕
口頭発表（一般）, 日本語, 第236回ARC研究会, 国内会議
発表日 2021年

ネットワーク機器における高速なGZIP復号のためのキャッシュ利用効率向上手法
黒川雄亮; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会CPSY研究会, 国内会議
発表日 2020年

動画トラフィック検査除外手法のSnortにおける実装
祐野雅範; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会CPSY研究会, 国内会議
発表日 2020年

多頻度・順不同で到着するシーケンスデータの主キーごとの処理順序制約を満たすリアルタイム並列処理手法
山添高弘; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 第169回DBS研究会, 国内会議
発表日 2019年

TSUBAME3.0における製造ばらつきを考慮したGPUの電力モデリングの高速化
大八木哲哉; 浅田風太; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第172回HPC研究会, 国内会議
発表日 2019年

OpenFlowを用いた動画フローの非ミラーリングによるNIDS処理負荷の削減
高倉玲央; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会IA研究会, 国内会議
発表日 2019年

テーブル検索回数の削減によるインターネットルータの高スループット化および省電力化
山下壮樹; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会IA研究会, 国内会議
発表日 2019年

キャッシュを利用したOpenFlow通信の高速化
祐野雅範; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 2019年電子情報通信学会総合大会, 国内会議
発表日 2019年

学習済み重みを利用した畳み込みニューラルネットワークの学習法の初期検討
横手宥則; 三輪忍; 井内悠太; 津邑公暁; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 2019年電子情報通信学会総合大会, 国内会議
発表日 2019年

ネットワークベースの攻撃に対応可能な高対話型ハニーポット
森瑞穂; 本多弘樹; 八巻隼人; 三輪忍
口頭発表（一般）, 日本語, 2019年電子情報通信学会総合大会, 国内会議
発表日 2019年

GPUの電力ばらつきモデリング
浅田風太; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 2019年電子情報通信学会総合大会, 国内会議
発表日 2019年

ネットワーク機器上における高速なGZIP復号のためのキャッシュ利用効率向上手法の提案
黒川雄亮; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 2019年電子情報通信学会総合大会, 国内会議
発表日 2019年

パケット処理キャッシュにおけるパイプライン化とマルチポート化の評価
田中京介; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 第229回ARC研究会, 国内会議
発表日 2019年

DFS/DCT 制御による電力あたり性能の実行時最適化
三吉郁夫; 三輪忍; 井上弘士; 近藤正章
口頭発表（一般）, 日本語, 第163回HPC研究会, 国内会議
発表日 2018年

ON/OFFリンクにおける通信開始遅延を低減するためのプリウェイクアップ手法の提案
松山朋樹; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（招待・特別）, 日本語, 情報処理学会第80回全国大会, 国内会議
発表日 2018年

ゲートウェイにおける攻撃パケットに着目したテーブル検索負荷削減手法の提案
愛甲達也; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 第222回ARC研究会, 国内会議
発表日 2018年

HSPICEを用いたシリコン回路とカーボンナノチューブ回路の比較評価
松尾駿; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第222回ARC研究会, 国内会議
発表日 2018年

高電力効率なCNNアクセラレータ実現に向けたカーネルクラスタリングの応用の検討
進藤智司; 松井優樹; 八巻隼人; 津邑公暁; 三輪忍
口頭発表（一般）, 日本語, 第222回ARC研究会, 国内会議
発表日 2018年

CNN計算の省メモリ化のためのカーネル・クラスタリング手法の検討
松井優樹; 三輪忍; 進藤智司; 津邑公暁; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会コンピュータシステム研究会, 国内会議
発表日 2018年

NVDIMMを用いたメモリスナップショットの解析システム
三須雅仁; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 電子情報通信学会コンピュータシステム研究会, 国内会議
発表日 2018年

プリウェイクアップ手法によるON/OFFリンクの消費エネルギー削減
松山朋樹; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第165回HPC研究会, 国内会議
発表日 2018年

1Tbps実現に向けたルータのメモリ階層の最適化
田中京介; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, 第225回ARC研究会, 国内会議
発表日 2018年

ジョブ実行中の計算ノードにおけるDIMM待機電力削減手法の実装と評価
石原雅也; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, 第158回HPC研究会, 国内会議
発表日 2017年

マルチコアニューラルネットワークアクセラレータにおけるデータ転送のブロードキャスト化
大場百香; 三輪忍; 進藤智司; 津邑公暁; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, ETNET, 国内会議
発表日 2017年

パケット処理キャッシュにおける送信元IPアドレスに着目したミス削減手法に関する初期検討
八巻隼人; 愛甲達也; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, HotSpa, 国内会議
発表日 2017年

高電力効率なCNNアクセラレータ実現に向けたカーネルクラスタリングの応用の検討
進藤智司; 松井優樹; 八巻隼人; 津邑公暁; 三輪忍
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2017年

動画トラフィックに着目したNIDSにおける文字列探索処理負荷削減手法の提案
高徳真晴; 八巻隼人; 三輪忍; 本多弘樹
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2017年

電力性能推定を目的としたインターコネクト・シミュレータTraceRPの開発
小野貴継; 垣深悠太; 三輪忍; 井上弘士
口頭発表（一般）, 日本語, 第161回HPC研究会, 国内会議
発表日 2017年

ハードウェアを増やしてコンピュータを省エネに
三輪忍
口頭発表（招待・特別）, 日本語, IPSJ-ONE, 国内会議
発表日 2016年03月12日

ニューラルネットワークアクセラレータにおけるコア間通信量最小化のためのタスク配置手法
進藤智司; 大場百香; 津邑公暁; 三輪忍
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2016年

再構成可能なニューラルネットワークアクセラレータの提案と性能分析
大場百香; 三輪忍; 進藤智司; 津邑公暁; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2016年

ヘテロジニアス・プロセッサの設計探索手法の初期検討
澁谷俊憲; 三輪忍; 塩谷亮太; 佐々木広; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2016年

メモリホットプラグを用いたメインメモリの省電力化に関する初期検討
石原雅也; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2016年

リンクオフスレッショルドを有するON/OFFリンクの電力見積手法の初期検討
西郷雄斗; 三輪忍; 八巻隼人; 本多弘樹
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2016年

TLBミスペナルティ削減のための大容量LLCの利用法に関する初期検討
有間英志; 三輪忍; 中田尚; 中村宏
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2015年

演算器におけるオペランド値を考慮したパワーゲーティングに関する初期検討
石川雄介; 小柴篤史; 坂本龍一; 和田康孝; 三輪忍; 近藤正章; 並木美太郎; 本多弘樹
ポスター発表, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2015年

ターボ・モード強化のための面積効率に優れたマイクロプロセッサとその設計手法
三輪忍; 井上聖等; 中村宏
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2014年

ダーク・シリコン時代のプロセッサ・アーキテクチャに関する初期検討
三輪忍; 塩谷亮太; 佐々木広
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2014年

回路資源の投入により電力効率を改善するプロセッサ・アーキテクチャ
三輪忍; 塩谷亮太; 佐々木広
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2014年

Power Shifting between Networks and CPUs in HPC Sytems
Shinobu Miwa; Hiroshi Nakamura
口頭発表（招待・特別）, 英語, JST/CREST International Symposium on Post Petascale System Software, 招待, 国際会議
発表日 2014年

ダーク・シリコン時代のプロセッサの省電力技術
三輪忍
口頭発表（招待・特別）, 日本語, 組込みシステムシンポジウム2014, 招待, 国内会議
発表日 2014年

アクセスの局所性に着目したSTT-MRAMキャッシュの周辺回路の電源制御手法
有間英志; 野口紘希; 中田尚; 三輪忍; 武田進; 藤田忍; 中村宏
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2014年

FPGAを用いたDalvikアクセラレータの実装と評価
老子裕輝; 吉實大輔; 太田淳; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 情報処理学会組込みシステム研究会, 国内会議
発表日 2014年

電力制約下における蓄電池を用いたHPCシステムの性能向上
酒井崇至; 薦田登志矢; 三輪忍; 中村宏
口頭発表（一般）, 日本語, 情報処理学会ハイパフォーマンスコンピューティング研究会, 国内会議
発表日 2014年

物理メモリの増減による電力制約下でのHPCシステムの性能向上
米澤亮太; 會田翔; 三輪忍; 中村宏
口頭発表（一般）, 日本語, 情報処理学会ハイパフォーマンスコンピューティング研究会, 国内会議
発表日 2014年

ロードバランスを考慮した電力制約下におけるCPUのDVFS制御
會田翔; 三輪忍; 中村宏
口頭発表（一般）, 日本語, 情報処理学会ハイパフォーマンスコンピューティング研究会, 国内会議
発表日 2014年

Power Management Framework for Post-Petascale Supercomputers
M. Kondo; T. CAO; Y. He; Y. Wada; H. Honda; I. Miyoshi; Y. Inadomi; K. Fukazawa; K. Inoue; S. Miwa; H. Nakamura
ポスター発表, 英語, JST/CREST International Symposium on Post Petascale System Software, 招待, 国際会議
発表日 2014年

周期実行システムにおける中間データに着目した電力制御手法
重松拓也; 薦田登志矢; 中田尚; 三輪忍; 佐藤洋平; 植木浩; 林越正紀; 清水徹; 中村宏
口頭発表（一般）, 日本語, 情報処理学会組込みシステム研究会, 国内会議
発表日 2013年

電力制約下におけるCPUとネットワークの電力制御協調手法
會田翔; 三輪忍; 中村宏
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2013年

ALUローテーションによるスーパスカラプロセッサの性能向上
井上聖等; 三輪忍; 中田尚; 中村宏
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2013年

CMPにおけるキャッシュ・データを考慮したスレッド・スケジューリング手法の初期検討
三輪忍; 角崎宏一; 佐々木広; 中村宏
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2012年

FX10におけるインタコネクト・コントローラの省電力化手法の初期検討
三輪忍; 會田翔; 安島雄一郎; 清水俊幸; 安里彰; 中村宏
口頭発表（一般）, 日本語, HOKKE, 国内会議
発表日 2012年

OSの電力管理下におけるラスト・レベル・キャッシュのリーク削減手法の比較
有間英志; 薦田登志矢; 三輪忍; 野口紘希; 野村久美子; 安部恵子; 藤田忍; 中村宏
口頭発表（一般）, 日本語, 第25回回路とシステムワークショップ講演集, 国内会議
発表日 2012年

バイパス専用ALUを用いる事による小面積高スループットプロセッサ
斎藤和明; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, HOKKE, 国内会議
発表日 2012年

NoC型メニーコア設計のための高速キャッシュシミュレーション
中田尚; 三輪忍; 中村宏
口頭発表（一般）, 日本語, HOKKE, 国内会議
発表日 2012年

ユーザの快適さを考慮した情報機器の動的電源制御
岩澤直弘; 薦田登志矢; 三輪忍; 中田尚; 中村宏
口頭発表（一般）, 日本語, FIT, 国内会議
発表日 2012年

周期実行システムにおける省電力スケジューリングの初期検討
岡本和也; 薦田登志矢; 中田尚; 三輪忍; 佐藤洋平; 植木浩; 林越正紀; 清水徹; 中村宏
口頭発表（一般）, 日本語, 情報処理学会組込みシステム研究会, 国内会議
発表日 2012年

レジスタ・ファイルと実行ユニットにおけるアクティビティ・マイグレーション
井上聖等; 三輪忍; 中田尚; 中村宏
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2012年

命令グループごとのキャッシュ・パーティショニングの予備評価
浅見公輔; 倉田成己; 塩谷亮太; 三輪忍; 五島正裕; 坂井修一
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2012年

アイドル時のキャッシュ電源遮断における性能ペナルティ削減手法の実装
有間英志; 薦田登志矢; 三輪忍; 中村宏
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2012年

CPU/GPU間データ通信向け先読み機構の検討
薦田登志矢; 三輪忍; 中村宏
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2012年

命令グループのワーキング・セットに着目したキャッシュ・マネジメント
浅見公輔; 倉田成己; 塩谷亮太; 三輪忍; 五島正裕; 坂井修一
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2012年

キャッシュの利用効率の向上に関する研究
浅見公輔; 倉田成己; 塩谷亮太; 三輪忍; 五島正裕; 坂井修一
口頭発表（一般）, 日本語, 情報処理学会第74回全国大会, 国内会議
発表日 2012年

アイドル時のキャッシュ電源遮断による性能ペナルティとその削減手法
有間英志; 薦田登志矢; 三輪忍; 中村宏
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2012年

データ保持性を利用したキャッシュのパワーゲーティング手法
金均東; 武田清大; 三輪忍; 中村宏
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2012年

ロード/ストアの命令アドレスによる選択的キャッシュ・ライン・アロケーション
堀部悠平; 三輪忍; 塩谷亮太; 五島正裕; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2011）, 国内会議
発表日 2011年

スリープ深度制御による動作時リーク電力削減
武田清大; 三輪忍; 中村宏
口頭発表（一般）, 日本語, 電子情報通信学会集積回路研究会, 国内会議
発表日 2011年

メニーコアプロセッサにおける競合とスケーラビリティを考慮したスレッドスケジューリング
谷本輝夫; 佐々木広; 三輪忍; 中村宏
口頭発表（一般）, 日本語, HOKKE, 国内会議
発表日 2011年

OpenCLを用いたパイプライン並列プログラミングAPIの初期検討
薦田登志矢; 三輪忍; 中村宏
口頭発表（一般）, 日本語, HOKKE, 国内会議
発表日 2011年

キャッシュデータをマイグレーションするCMPにおけるスレッドマイグレーション
角崎宏一; 佐々木広; 三輪忍; 中村宏
口頭発表（一般）, 日本語, 電子情報通信学会集積回路研究会, 国内会議
発表日 2011年

データ符号化によるラスト・レベル・キャッシュの回路面積削減
横山弘基; 堀部悠平; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2011年

小容量CAMを用いたレジスタ・マップ表の回路面積削減
三輪忍; 張鵬; 横山弘基; 堀部悠平; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2010）, 国内会議
発表日 2010年

Dalvik アクセラレータ：Android 端末における Java アプリケーションの高速実行機構
太田淳; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 組込みシステムシンポジウム2010, 国内会議
発表日 2010年

Hilbert-Huang 変換の並列化および GPU による高速化
Pulung Waskito; 三輪忍; 満倉靖恵; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2010）, 国内会議
発表日 2010年

選択的キャッシュ・ライン・アロケーションによるキャッシュの容量効率向上
堀部悠平; 三輪忍; 塩谷亮太; 五島正裕; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2010）, 国内会議
発表日 2010年

Dalvik アクセラレータのための MIPS シミュレータを用いた評価環境
太田淳; 茂手木貴彦; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2010）, 国内会議
発表日 2010年

選択的キャッシュ・アロケーション：マルチスレッド環境におけるキャッシュ利用効率の向上手法
堀部悠平; 三輪忍; 塩谷亮太; 五島正裕; 中條拓伯
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2010年

Accelerating Hilbert-Huang Transform using GPU
P. Waskito; S. Miwa; Y. Mitsukura; H. Nakajo
口頭発表（一般）, 英語, SWoPP, 国内会議
発表日 2010年

経験的モード分解を用いた雑音環境下における警笛抽出手法
中西正樹; 満倉靖恵; 田中聡久; 三輪忍; 中條拓伯
口頭発表（一般）, 英語, 電気学会研究会資料産業計測制御研究会, 国内会議
発表日 2010年

スケジュールド命令キャッシュを用いた高速な命令供給手法
三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2009年

SMTプロセッサにおけるL1/L2キャッシュアクセス動的切替方式
小笠原嘉泰; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2009）, 国内会議
発表日 2009年

メモリ・アクセス・パターンを利用した高精度ハードウェア・プリフェッチ手法
堀部悠平; 張鵬; 小笠原嘉泰; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, HOKKE, 国内会議
発表日 2009年

並列／分散処理環境における組込み仮想マシンの実現可能性
矢野裕章; 中西正樹; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2009年

分岐予測精度改善のための決定的な分岐フィルタ機構
三輪忍; 中條拓伯
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2008年

圧縮されたパス情報を用いた分岐予測手法
三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2008）, 国内会議
発表日 2008年

FPGA におけるマルチ SMT プロセッサの実装
小笠原嘉泰; 館一平; 三輪忍; 中條拓伯
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2008）, 国内会議
発表日 2008年

ALU Cascading のための動的命令スケジューラ
尾形幸亮; 姚駿; 嶋田創; 三輪忍; 富田眞治
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2008）, 国内会議
発表日 2008年

コンテキスト・ベース値予測を利用した分岐先予測器
平嶋哲朗; 嶋田創; 三輪忍; 富田眞治
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2008年

小容量RAMを用いたオペランド・バイパスの複雑さの低減手法
三輪忍; 一林宏憲; 入江英嗣; 五島正裕; 富田眞治
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2007）, 国内会議
発表日 2007年

並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装
川原崇宏; 三輪忍; 嶋田創; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 電子情報通信学会リコンフィギュラブル研究会, 国内会議
発表日 2007年

インタラクティブ流体シミュレータにおける力覚提示モデルに関する検討
山口明徳; 三輪忍; 嶋田創; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 日本バーチャルリアリティ学会第12回大会論文集, 国内会議
発表日 2007年

故障に対してユーザ側の耐性を高めるデジタル家電アーキテクチャ
嶋田創; 三輪忍; 富田眞治
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2007年

PCクラスタを用いた手術シミュレータにおける手術手技の連続性を考慮した高速化
野田裕介; 依藤逸; 三輪忍; 粂直人; 嶋田創; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 日本バーチャルリアリティ学会第12回大会論文集, 国内会議
発表日 2007年

ビットベクタを利用した選択的命令再発行機構
嶋田創; 三輪忍; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2007年

インタラクティブシミュレーションにおける遠隔操作フレームワークの実装
橋本健介; 嶋田創; 三輪忍; 幡生安紀; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2007年

操作の連続性を考慮した手術シミュレータの高速化手法
依藤逸; 野田裕介; 吉田智一; 粂直人; 三輪忍; 嶋田創; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2007年

ALU Cascadingを行う動的命令スケジューラ
尾形幸亮; 姚駿; 三輪忍; 嶋田創; 富田眞治
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2007年

パス情報を用いた分岐フィルタ機構
三輪忍; 福山智久; 嶋田創; 五島正裕; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2006）, 国内会議
発表日 2006年

スラック予測を用いたクラスタ型スーパースカラ・プロセッサ向け命令ステアリング
福山智久; 三輪忍; 嶋田創; 五島正裕; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2006年

DVI-Dを用いた高速低遅延データ転送の実装と並列画像合成処理への応用
川原崇宏; 野田裕介; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 平成18年度情報処理学会関西支部支部大会, 国内会議
発表日 2006年

共役勾配法による手術シミュレータ高速化の予備評価
野田裕介; 吉田智一; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 平成18年度情報処理学会関西支部支部大会, 国内会議
発表日 2006年

中規模コモディティクラスタ向け相互結合網 Three Quads の提案
吉村知普; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 情報処理学会計算機アーキテクチャ研究会, 国内会議
発表日 2006年

DVI による超高速単方向リンクを用いた並列ボリュームレンダリング
岡村大; 野田祐介; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 情報処理学会システムとLSI設計技術の研究会, 国内会議
発表日 2006年

スラック予測を用いた省電力アーキテクチャ向け命令スケジューリング
福山智久; 福田匡則; 三輪忍; 小西将人; 五島正裕; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 先進的計算基盤システムシンポジウム（SACSIS2005）, 国内会議
発表日 2005年

汎用 GPU を用いたボリュームレンダリングにおけるテクスチャアクセスの改善
篠本雄基; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, 平成17年度情報処理学会関西支部支部大会, 国内会議
発表日 2005年

並列ボリュームレンダリングにおける投機的描画に関する考察
篠本雄基; 三輪忍; 嶋田創; 中島康彦; 森眞一郎; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2005年

リカレントニューラルネットにおける移動ロボットのナビゲーション課題の学習
三輪忍; 永野貴宣; 五島正裕; 中島康彦; 富田眞治
口頭発表（一般）, 日本語, 平成15年度情報処理学会関西支部支部大会, 国内会議
発表日 2003年

学習による非同期連続状態機械の構成
津田晃寿; 三輪忍; 津邑公暁; 五島正裕; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2002年

コンダクタンスニューラルネットによるGSMの構成
三輪忍; 津田晃寿; 津邑公暁; 五島正裕; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2001年

コンダクタンスニューロンモデルを用いた順序回路の実現
津田晃寿; 三輪忍; 津邑公暁; 五島正裕; 富田眞治
口頭発表（一般）, 日本語, SWoPP, 国内会議
発表日 2001年

記憶構造観測のための神経網シミュレーション
津邑公暁; 三輪忍; 五島正裕; 富田眞治
口頭発表（一般）, 日本語, 計測自動制御学会システム工学部研究会, 国内会議
発表日 2000年

担当経験のある科目_授業

情報数理工学/コンピュータサイエンス実験第二A/B
2024年04月 - 現在
電気通信大学

論理設計学
2018年 - 現在
電気通信大学

並列処理論第二
2016年 - 現在
電気通信大学

情報数理工学/コンピュータサイエンス実験第二A/B
2018年 - 2023年03月
電気通信大学

大学院技術英語
2019年 - 2021年
電気通信大学

高性能コンピューティング論2
2015年 - 2017年
電気通信大学

情報数理工学/ンピュータサイエンス実験第一
2016年 - 2016年
電気通信大学

情報システム基盤学基礎1
2015年 - 2016年
電気通信大学

所属学協会

情報処理学会

電子情報通信学会

IEEE

共同研究・競争的資金等の研究課題

Beyond CMOSのための省配線プロセッサアーキテクチャとその自動生成に関する研究
三輪忍; 塩谷亮太
日本学術振興会, 科学研究費助成事業, 電気通信大学, 基盤研究(B), 24K02913
研究期間 2024年04月01日 - 2028年03月31日

階層型ストレージを活用した基盤モデル学習のI/Oの高速化
佐藤賢斗; 三輪忍
日本学術振興会, 科学研究費助成事業, 国立研究開発法人理化学研究所, 基盤研究(C), 24K14974
研究期間 2024年04月01日 - 2027年03月31日

メモリ帯域幅セントリックコンピューティングの創出
三輪忍; 塩谷亮太
日本学術振興会, 科学研究費助成事業, 電気通信大学, 挑戦的研究(萌芽), 23K18461
研究期間 2023年06月 - 2026年03月

ポストペタスケールのための革新的アプリケーション解析基盤技術の開発
三輪忍
日本学術振興会, 科学研究費助成事業基盤研究(B), 電気通信大学, 基盤研究(B), 2021年度はプロファイル，トレースそれぞれの予測技術の開発を行った．それぞれの開発状況を以下にまとめる．
プロファイル予測に関しては，プロファイルに含まれる実行時情報の中で関数コール回数とキャッシュミス数に着目し，それぞれの実行時情報を予測する手法を開発した．具体的には，少ないコア数，小さな問題サイズで取得したプロファイルを用いて当該実行時情報を予測するモデルをフィッティングし，フィッティングにより得られたモデルを用いて多いコア数，大きな問題サイズで当該プログラムを実行した際の当該実行時情報を予測する．予測に使用するモデルとして，線形関数，指数関数など複数の関数を組み合わせたモデルを新たに開発した．NPBを用いて評価を行ったところ，小さな問題サイズかつ少ない並列数の実行結果から大きな問題サイズかつ多くの並列数の実行結果を予測する場合において，高い精度で予測できることを確認した．また，提案手法により，プロファイル取得に要するコストを大幅に削減できることを確認した．なお，実験にはTSUBAME3.0を使用した．
トレース予測に関しては，タイムスタンプ予測技術の開発を行った．具体的には，先行研究で提案されているタイムスタンプ予測手法を分析し，通信関数の呼び出し回数が並列数だけでなく問題サイズにも依存するアプリケーションに対して予測精度が悪化することを明らかにした．また，上記の問題を解決するために，並列数だけでなく問題サイズも用いて通信関数の呼び出し回数を予測するモデルを新たに考案し，このモデルを用いてタイムスタンプ予測を行ったところ，通信関数の呼び出し回数が問題サイズにも依存するアプリケーションに対して先行研究の手法よりも高い予測精度を示すことを確認した．, 20H04193
研究期間 2020年04月01日 - 2024年03月31日

ポストペタスケールのための革新的アプリケーション解析基盤の展開
三輪忍
日本学術振興会, 科学研究費助成事業国際共同研究加速基金(国際共同研究強化(A)), 電気通信大学, 国際共同研究加速基金(国際共同研究強化(A)), 研究代表者, 22KK0182
研究期間 2022年 - 2024年

次世代大規模並列環境における資源管理機構
KDDI財団, 研究助成
研究期間 2020年04月 - 2023年03月

超微細ナノカーボン・プロセッサのアーキテクチャに関する研究
三輪忍
日本学術振興会, 科学研究費助成事業挑戦的研究(萌芽), 電気通信大学, 挑戦的研究(萌芽), 本研究課題の主要な成果は2つある．1つ目の研究成果は，先行研究で使用されていた実質的に非公開のCNFETプロセッサの開発環境に限りなく近い開発環境を再現できたことである．これにより，CNFETプロセッサ・アーキテクチャの開発と評価を行うことが可能となった．2つ目の研究成果は，上記の開発環境を用いて評価・分析を行うことにより，CNFET化によるプロセッサ内の各ユニットへの影響を世界で初めて明らかにしたことである．この評価・分析によって得られた知見は，今後CNFET向けにプロセッサ・アーキテクチャの最適化を行う上で重要な指針となることが期待される．, 18K19778
研究期間 2018年06月29日 - 2022年03月31日

HPCユーザのためのTEE利用支援フレームワーク
JST, 研究代表者, 国内共同研究
研究期間 2022年

高性能計算環境におけるAIアプリケーションの性能評価とメモリモデルの検討
三輪忍
キオクシア, 研究代表者, 国内共同研究
研究期間 2019年 - 2021年

超大規模計算環境におけるMPI並列アプリケーションのプロファイル予測に関する研究
三輪忍
栢森情報科学振興財団, 研究助成, 研究代表者
研究期間 2018年11月 - 2020年10月

ポストペタスケールシステムのための電力マネージメントフレームワークの開発
近藤正章
JST, 研究分担者, 国内共同研究
研究期間 2012年 - 2018年

ノーマリーオフコンピューティング基盤技術開発
三輪忍
東芝, 研究代表者, 国内共同研究
研究期間 2015年 - 2016年

時空間上のデータ制御実行モデルの研究
中村宏; 三輪忍
日本学術振興会, 科学研究費助成事業挑戦的萌芽研究, 東京大学, 挑戦的萌芽研究, 連携研究者, コンピューティングの高性能化と低消費電力化を妨げる要因は演算や処理を行う部分ではなく、演算処理部と記憶部の間のデータ転送、および記憶部へのデータアクセスにある。この問題を解決すべく、データ移動と処理の「タイミング」、およびデータの「物理的な場所」を陽に制御する、新しい実行モデル「時空間上のデータ制御実行モデル」を提案し、このモデルに基づく実行最適化手法を研究した。多様なコンピューティングシステムに対する有効性を検討するために、提案する手法を、３次元積層VLSIシステム、高性能サーバシステム、ならびにセンサネットワークシステムに対して適用し、その有効性を確認した。, 25540018
研究期間 2013年04月 - 2015年03月

ヒート・スプレッド指向プロセッサに関する研究
三輪忍
日本学術振興会, 科学研究費助成事業若手研究(B), 東京大学, 若手研究(B), 研究代表者, 近年のマイクロプロセッサの性能はチップ温度によって制限を受けることが多い．そこで本課題ではチップ温度を低減する方法を研究開発し，それによるプロセッサ性能の向上を目指した．提案手法では，近年の商用プロセッサにおいて広く採用されているターボ・モードに着目し，アクティビティ・マイグレーションと呼ばれる手法を用いることでターボ・モード中にプロセッサが利用可能な最大周波数を引き上げる．アクティビティ・マイグレーションを空間的に細粒度に行う手法とそれを適用したプロセッサの設計手法を開発し，シミュレータを用いて評価を行った結果，提案手法により2.8%のチップ面積の増加で最大14.5%の性能向上を達成した．, 24700044
研究期間 2012年04月01日 - 2014年03月31日

産業財産権

ルータ
特許権, 和遠, 三輪忍, 中村宏, 111244, 出願日: 2013年

変換器及び変換方法
特許権, 三輪忍, 太田淳, 中條拓伯, 234673, 出願日: 2010年

三輪 忍

対象リソース

学位

研究キーワード

研究分野

経歴

学歴

委員歴

受賞

論文

MISC

書籍等出版物

講演・口頭発表等

担当経験のある科目_授業

所属学協会

共同研究・競争的資金等の研究課題

産業財産権

三輪　忍