吉永 努
情報・ネットワーク工学専攻 | 教授 |
Ⅰ類(情報系) | 教授 |
メタネットワーキング研究センター | 教授 |
- プロフィール:
1988~1999:宇都宮大学・助手として,並列オブジェクト指向トータルアーキテクチャA-NETの開発
2000年に電気通信大学・助教授に着任し,分散並列処理計算機ネットワーク、クラスタコンピューティング、クラウド,再構成可能システムなどの研究に従事
2010年,電気通信大学・大学院情報システム学研究科・教授
2016年,電気通信大学・大学院情報理工学研究科・教授
現在に至る.
研究者情報
学位
経歴
委員歴
- 2017年06月 - 現在
コンピュータシステム研究専門委員会 顧問, 電子情報通信学会, 学協会 - 2017年03月 - 現在
フェロー, 電子情報通信学会, 学協会 - 2012年05月 - 現在
シニア会員, 電子情報通信学会, 学協会 - 2015年06月 - 2017年06月
コンピュータシステム研究専門委員, 電子情報通信学会, 学協会 - 2016年11月
コンピュータ科学教育委員会委員, 情報処理学会, 学協会 - 1999年 - 2016年05月
論文誌査読委員, 電子情報通信学会, 学協会 - 2013年05月 - 2015年05月
コンピュータシステム研究会 委員長, 電子情報通信学会, 学協会 - 2010年11月 - 2014年05月
英文論文誌D 編集委員, 電子情報通信学会, 学協会 - 2011年05月 - 2013年04月
コンピュータシステム研究会 副委員長, 電子情報通信学会, 学協会 - 2005年05月 - 2011年05月
コンピュータシステム研究専門委員, 電子情報通信学会, 学協会 - 2006年05月 - 2010年05月
和文論文誌D編集委員, 電子情報通信学会, 学協会 - 2006年06月 - 2009年05月
シニア査読委員, 情報処理学会, 学協会 - 2007年05月 - 2009年03月
情報システム教育委員, 情報処理学会, 学協会 - 2002年 - 2005年05月
コンピュータシステム研究会 幹事, 電子情報通信学会, 学協会 - 2001年 - 2005年
論文誌編集委員, 情報処理学会, 学協会 - 1995年 - 1997年
計算機アーキテクチャ研究会連絡委員, 情報処理学会, 学協会
研究活動情報
受賞
論文
- Load-based Content Allocation Scheme for Realizing Efficient Mobile Cooperative Cache
Taiki Akiba; Celimuge Wu; Tsutomu Yoshinaga
ラスト(シニア)オーサー, International Journal of Networking and Computing, 13巻, 2号, 掲載ページ 93-117, 出版日 2023年07月, 査読付
研究論文(学術雑誌), 英語 - Blockchain-Enabled Internet of Vehicles Applications
Junting Gao; Chunrong Peng; Tsutomu Yoshinaga; Guorong Han; Siri Guleng; Celimuge Wu
Electronics, MDPI AG, 12巻, 6号, 掲載ページ article 1335-62 pages, 出版日 2023年03月11日, Internet of Vehicles (IoV) is a network that connects vehicles and everything. IoV shares traffic data by connecting vehicles with the surrounding environment, which brings huge potential to people’s life. However, a large number of connections and data sharing will seriously consume vehicle resources during the interaction. In addition, how to build a safe and reliable connection to ensure vehicle safety is also an issue to consider. To solve the above problems, researchers introduce blockchains into IoV to build a safe and reliable vehicle network relying on the distributed account structure, immutable, transparent and security features of blockchains. We have investigated the application of blockchains in IoV in recent years, and have summarized and compared these studies according to their purposes. On this basis, we also point out the future trends and opportunities.
研究論文(学術雑誌), 英語 - Semantic segmentation-based semantic communication system for image transmission
Jiale Wu; Celimuge Wu; Yangfei Lin; Tsutomu Yoshinaga; Lei Zhong; Xianfu Chen; Yusheng Ji
Digital Communications and Networks, Elsevier BV, 掲載ページ 11 pages, 出版日 2023年02月
研究論文(学術雑誌), 英語 - A communication-efficient distributed machine learning scheme in vehicular network.
Yalong Li; Celimuge Wu; Lei Zhong; Tsutomu Yoshinaga
Proceedings of the Conference on Research in Adaptive and Convergent Systems (RACS22), 7 pages巻, 掲載ページ 92-98, 出版日 2022年10月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Fuzzy Logic based Client Selection for Federated Learning in Vehicular Networks
Narisu Cha; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Lei Zhong; Jing Ma; Fuqiang Liu; Yusheng Ji
IEEE Open Journal of the Computer Society, IEEE, 3巻, 掲載ページ 39-50, 出版日 2022年03月31日, 査読付, In vehicular networks, the problem of choosing proper clients is particularly complex due to the heterogeneity of network users, including the differences in the data, computation capability, available throughput, and samples freshness. We design a fuzzy logic based client selection scheme to address this issue.
研究論文(学術雑誌), 英語 - Toward Efficient Blockchain for the Internet of Vehicles with Hierarchical Blockchain Resource Scheduling
Liming Gao; Celimuge Wu; Zhaoyang Du; Tsutomu Yoshinaga; Lei Zhong; Fuqiang Liu; Yusheng Ji
MDPI Electronics, MDPI, 11巻, 5号, 掲載ページ 1-21, 出版日 2022年03月07日, 査読付, In this paper, we propose a hierarchical resource scheduling scheme for blockchain-enabled IoV systems that improves the performance of the blockchain-enabled IoV system by efficiently allocating computational resources. The superiority of the proposed method is fully demonstrated by comparing it with existing baseline methods.
研究論文(学術雑誌), 英語 - A Reinforcement Learning based Edge Cloud Collaboration
Hiroki Kobari; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao
Proc. of 2021 International Conference on Information and Communication Technologies for Disaster Management (ICT-DM), IEEE, 4 pages巻, 掲載ページ 26-29, 出版日 2021年12月03日, 査読付
研究論文(国際会議プロシーディングス), 英語 - Deep Reinforcement Learning Based Mode Selection for Coexistence of D2D-U and Wi-Fi
Ganggui Wang; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Rui Yin
Proc. of 2021 International Conference on Information and Communication Technologies for Disaster Management (ICT-DM), IEEE, 6 pages巻, 掲載ページ 9-14, 出版日 2021年12月03日, 査読付
研究論文(国際会議プロシーディングス), 英語 - Resource Management for Blockchain-enabled Internet of Vehicles
Liming Gao; Chunrong Peng; Qitu Hu; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Siri Guleng
Proc. of 2021 International Conference on Information and Communication Technologies for Disaster Management (ICT-DM), IEEE, 7 pages巻, 掲載ページ 164-170, 出版日 2021年12月03日, 査読付
研究論文(国際会議プロシーディングス), 英語 - A Fuzzy Logic Controller for Greenhouse Temperature Regulation System Based on Edge Computing.
Yue Ren; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao
Mobile Networks and Management - 11th EAI International Conference(MONAMI), Springer, 18 pages巻, 掲載ページ 316-332, 出版日 2021年10月, 査読付
研究論文(国際会議プロシーディングス), 英語 - UAV-Empowered Vehicular Networking Scheme for Federated Learning in Delay Tolerant Environments
Zhaoyang Du; Ganggui Wang; Narisu Cha; Celimuge Wu; Tsutomu Yoshinaga; Rui Yin
Proc. of The 24th IEEE international conference on computational science and engineering (IEEE CSE 2021), IEEE, 掲載ページ 72-79, 出版日 2021年10月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Integrating autonomous decentralized communication and edge computing for real-time control in IoT system
Masaya Harada; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Yusheng Ji
Proc. of The 7th Euro-China Conference on Intelligent Data Analysis and Applications (ECC-2021), 9 pages巻, 出版日 2021年05月, 査読付
研究論文(国際会議プロシーディングス), 英語 - A Brief Review of Multipath TCP for Vehicular Networks
Luomeng Chao; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Yusheng Ji
MDPI Open Access Journal Sensors, MDPI, 21巻, 8号, 掲載ページ 1-34, 出版日 2021年04月15日, 査読付, In this paper, we first conduct a brief survey of existing MPTCP studies and give a brief overview to multipath routing. Then we discuss the significance technical challenges in applying MPTCP for vehicular networks and point out future research directions.
研究論文(学術雑誌), 英語 - Coexistence Analysis of D2D-Unlicensed and Wi-Fi Communications
Ganggui Wang; Celimuge Wu; Tsutomu Yoshinaga; Rui Yin; Tutomu Murase; Kok-Lim Alvin Yau; Wugedele Bao; Yusheng Ji
Wireless Communications and Mobile Computing Journal, Hindawi, 2021巻, Article ID 5523273号, 掲載ページ 1-11, 出版日 2021年03月25日, 査読付
研究論文(学術雑誌), 英語 - Virtual Edge: Exploring Computation Offloading in Collaborative Vehicular Edge Computing
Narisu Cha; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Kok-Lim Alvin Yau
IEEE Access, IEEE, 9巻, 掲載ページ 37739-37751, 出版日 2021年03月02日, 査読付, We design a virtual edge formation algorithm that considers both the stability of virtual edge and the computational resources available at the vehicles constituting the virtual edge.
研究論文(学術雑誌), 英語 - A Peak-Avoidance Scheme for Chasing Playback of Mobile Live Streaming
Hiroki Okada; Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
Proc. of the 2020 Eighth International Symposium on Computing and Networking Workshops (CANDARW), IEEE, 掲載ページ 474-476, 出版日 2021年02月22日, 査読付, In this study, we propose a mechanism called Adaptive Failsoft Control to avoid peak traffic in mobile live streaming with a chasing playback function.
研究論文(国際会議プロシーディングス), 英語 - Virtual Edge: Collaborative Computation Offloading in VANETs
Narisu Cha; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Proc. of the 10th EAI International Conference on Mobile Networks and Management (MONAMI 2020), (LNICST,volume 338), Springer Nature Switzerland AG 2020., 掲載ページ 79-93, 出版日 2020年12月22日, 査読付, In this paper, we propose a virtual edge scheme where a node can offload its tasks to a virtual edge node that consists of multiple vehicles in vicinity.
研究論文(国際会議プロシーディングス), 英語 - UAV-empowered Protocol for empowered Protocol for Information Sharing in VDTN
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
Proc. of The 16th International Conference on Mobility, Sensing and Networking (MSN 2020), IEEE, 掲載ページ 626-627, 出版日 2020年12月17日, 査読付
研究論文(国際会議プロシーディングス), 英語 - Context-Aware Clustering for SDN Enabled Network
Ran Duo; Celimuge Wu; Yoshinaga Tsutomu; Yusheng Ji
AIMCOM2 Workshop at the 28th IEEE International Conference on Network Protocols (ICNP 2020), 出版日 2020年10月, 査読付
研究論文(国際会議プロシーディングス) - Vehicle Speed Prediction with Convolutional Neural Networks for ITS
Yifei Li; Celimuge Wu; Tsutomu Yoshinaga
Proc. of the 2020 IEEE/CIC International Conference on Communications in China (ICCC Workshops), IEEE, 掲載ページ 41-46, 出版日 2020年08月09日, 査読付, In this paper, we propose a convolutional neural network-based approach for a better estimation of vehicle traffics.
研究論文(国際会議プロシーディングス), 英語 - Collaborative Learning of Communication Routes in Edge-enabled Multi-access Vehicular Environment
Celimuge Wu; Zhi Liu; Fuqiang Liu; Tsutomu Yoshinaga; Yusheng Ji; Jie Li
IEEE Transactions on Cognitive Communications and Networking, IEEE, 4巻, 4号, 掲載ページ 1155-1165, 出版日 2020年06月15日, 査読付, In this paper, we propose a collaborative learning-based routing scheme for multi-access vehicular edge computing environment.
研究論文(学術雑誌), 英語 - Federated Learning for Vehicular Internet of Things: Recent Advances and Open Issues
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Kok-Lim Alvin Yau; Yusheng Ji; Jie Li
IEEE Open Journal of the Computer Society, IEEE, Early Access巻, 出版日 2020年05月06日, 査読付, In this paper, we first conduct a brief survey of existing studies on FL and its use in wireless IoT. Then we discuss the significance and technical challenges of applying FL in vehicular IoT, and point out future research directions.
研究論文(学術雑誌), 英語 - Federated Learning for Vehicular Internet of Things: Recent Advances and Open Issues
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Kok-Lim Alvin Yau; Yusheng Ji; Jie Li
IEEE Open Journal of the Computer Society, IEEE, 1巻, 61号, 掲載ページ 45-61, 出版日 2020年05月06日, 査読付, In this paper, we first conduct a brief survey of existing studies on FL and its use in wireless IoT. Then, we discuss the significance and technical challenges of applying FL in vehicular IoT, and point out future research directions.
研究論文(学術雑誌), 英語 - SDN-based Handover Scheme in Cellular/IEEE 802.11p Hybrid Vehicular Networks
Ran Duo; Celimuge Wu; Tsutomu Yoshinaga; Jiefang Zhang; Yusheng Ji
MDPI Open Access Journal Sensors, MDPI, 20巻, 4号, 掲載ページ 1-17, 出版日 2020年02月17日, 査読付
研究論文(学術雑誌), 英語 - Traffic Big Data Assisted Broadcast in Vehicular Networks
Siri Guleng; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Proceedings of the Conference on Research in Adaptive and Convergent Systems (RACS'19), ACM, 掲載ページ 236-240, 出版日 2019年09月24日, 査読付, In this paper, we propose a traffic big data assisted broadcast scheme in VANETs.
研究論文(国際会議プロシーディングス), 英語 - Traffic Flow Prediction with Compact Neural Networks
Yuhang Li; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Int. Conf. on Cloud and Big Data Computing (CBDCom), IEEE, 5 pages巻, 掲載ページ 1072-1076, 出版日 2019年08月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Integrating Licensed and Unlicensed Spectrum in Internet-of-Vehicles with Mobile Edge Computing
Celimuge Wu; Xianfu Chen; Tsutomu Yoshinaga; Yusheng Ji; Yan Zhang
IEEE Network Magazine, IEEE, 33巻, 4号, 掲載ページ 48-53, 出版日 2019年07月31日, 査読付, In this article, we propose a context-aware communication approach to efficiently integrate different licensed and unlicensed spectrums leveraging the edge computing technologies.
研究論文(学術雑誌), 英語 - Performance Evaluation of RPL-Based Sensor Data Collection in Challenging IoT Environment
Liming Gao; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Lecture Notes in Electrical Engineering, 536, Springer Nature Singapore Pte Ltd., 掲載ページ 275-285, 出版日 2019年05月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Computational Intelligence Inspired Data Delivery for Vehicle-to-roadside Communications
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Yan Zhang
IEEE Transactions on Vehicular Technology, IEEE, 67巻, 12号, 掲載ページ 12038-12048, 出版日 2018年12月, 査読付
研究論文(学術雑誌), 英語 - A Color-Based Cooperative Caching Strategy for Time-Shifted Live Video Streaming
Hiroki Okada; Takayuki Shiroma; Celimuge Wu; Tsutomu Yoshinaga
Proc. of the 6th International Symposium on Computer Systems and Architectures (CSA'18), 6 pages巻, 出版日 2018年11月29日, 査読付
研究論文(国際会議プロシーディングス), 英語 - The template-based sub-optimal content distribution for a D2D content sharing network
Takayuki Shiroma; Celimuge Wu; Tsutomu Yoshinaga
Proc. of the 6th International Symposium on Computing and Networking (CANDAR 2018), IEEE, 6 pages巻, 出版日 2018年11月28日, 査読付
研究論文(国際会議プロシーディングス), 英語 - System Performance Assessment and Sizing for Cloud-based Data Backup
Y. Taguchi; T. Yoshinaga
Journal of Information Processing (ACS), IPSJ, 11巻, 2号, 掲載ページ 1-10, 出版日 2018年11月, 査読付
研究論文(学術雑誌), 英語 - SDN-based Handover Approach in IEEE 802.11p and LTE hybrid vehicular networks
Ran Duo; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Proc. of The IEEE International Conference on Cloud and Big Data Computing (CBDCom 2018), IEEE, 6 pages巻, 出版日 2018年10月10日, 査読付
研究論文(国際会議プロシーディングス), 英語 - A Prophet-based DTN protocol for VANETs
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Proc. of The IEEE International Conference on Cloud and Big Data Computing (CBDCom 2018), IEEE, 4 pages巻, 掲載ページ 1876-1879, 出版日 2018年10月10日, 査読付
研究論文(国際会議プロシーディングス), 英語 - Spatial Intelligence toward Trustworthy Vehicular IoT
Celimuge Wu; Zhi Liu; Di Zhang; Tsutomu Yoshinaga; Yusheng Ji
IEEE Communications Magazine, IEEE, 56巻, 10号, 掲載ページ 22-27, 出版日 2018年10月, 査読付
研究論文(学術雑誌), 英語 - System Resource Management to Control the Risk of Data-Loss in Cloud-based Disaster Recovery
Yuichi Taguchi; Tsutomu Yoshinaga
Proc. of The 6th IEEE International Workshop on Architecture, Design, Deployment and Management of Networks and Applications (ADMNET), IEEE, 掲載ページ 210-215, 出版日 2018年07月23日, 査読付, A method for system resource management of a cloud-based disaster recovery is proposed.
研究論文(国際会議プロシーディングス), 英語 - A context-aware edge-based VANET communication scheme for ITS
Chang An; Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Yusheng Ji
Sensors (Switzerland), MDPI AG, 18巻, 7号, 掲載ページ 1-15, 出版日 2018年07月01日, 査読付, We propose a context-aware edge-based packet forwarding scheme for vehicular networks. The proposed scheme employs a fuzzy logic-based edge node selection protocol to find the best edge nodes in a decentralized manner, which can achieve an efficient use of wireless resources by conducting packet forwarding through edges. A reinforcement learning algorithm is used to optimize the last two-hop communications in order to improve the adaptiveness of the communication routes. The proposed scheme selects different edge nodes for different types of communications with different context information such as connection-dependency (connection-dependent or connection-independent), communication type (unicast or broadcast), and packet payload size. We launch extensive simulations to evaluate the proposed scheme by comparing with existing broadcast protocols and unicast protocols for various network conditions and traffic patterns.
研究論文(学術雑誌), 英語 - Cluster-Based Content Distribution Integrating LTE and IEEE 802.11p with Fuzzy Logic and Q-Learning
Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Lin Zhang; Yusheng Ji
IEEE Computational Intelligence Magazine, Institute of Electrical and Electronics Engineers Inc., 13巻, 1号, 掲載ページ 41-50, 出版日 2018年02月01日, 査読付, There is an increasing demand for distributing a large amount of content to vehicles on the road. However, the cellular network is not sufficient due to its limited bandwidth in a dense vehicle environment. In recent years, vehicular ad hoc networks (VANETs) have been attracting great interests for improving communications between vehicles using infrastructure-less wireless technologies. In this paper, we discuss integrating LTE (Long Term Evolution) with IEEE 802.11p for the content distribution in VANETs. We propose a two-level clustering approach where cluster head nodes in the first level try to reduce the MAC layer contentions for vehicle-tovehicle (V2V) communications, and cluster head nodes in the second level are responsible for providing a gateway functionality between V2V and LTE. A fuzzy logic-based algorithm is employed in the first-level clustering, and a Q-learning algorithm is used in the second-level clustering to tune the number of gateway nodes. We conduct extensive simulations to evaluate the performance of the proposed protocol under various network conditions. Simulation results show that the proposed protocol can achieve 23% throughput improvement in highdensity scenarios compared to the existing approaches.
研究論文(学術雑誌), 英語 - Assessment and simulation of system performance of a cloud-based data-protection system
Yuichi Taguchi; Tsutomu Yoshinaga
Journal of Information Processing, Information Processing Society of Japan, 26巻, 掲載ページ 687-695, 出版日 2018年, A method for assessing performance of a cloud-based remote data-protection system is proposed. This method makes it possible to determine whether the system performance achieves recovery point objective (RPO) or not. It is also necessary to resize the data-protection system for satisfying required performance with smaller expenses. Therefore, we established a formula for simulating system performance. Based on the results of the simulation, we show it is possible to determine an appropriate system size that achieves RPO as well as minimizes the amount of system resources. It is experimentally demonstrated that there are no gap between the experimentally measured and simulated recovery points at peak of system workload. So we concluded that the proposed simulation is accurate enough. Also, it is estimated that 89% of system resource expenses could be reduced in comparison to the situation in which data-protection system is designed to fit a peak workload.
研究論文(学術雑誌), 英語 - A learning-based probabilistic routing protocol for vehicular delay tolerant networks
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Proceedings of 4th International Conference on Information and Communication Technologies for Disaster Management (ICT-DM2017), IEEE, 掲載ページ 1-6, 出版日 2017年12月12日, 査読付, We propose a probabilistic routing protocol for VDTNs. The protocol takes into account the vehicle velocity, node centrality, and node buffer size using a fuzzy logic-based approach.
研究論文(国際会議プロシーディングス), 英語 - Vehicular multi-access edge computing with licensed sub-6 GHz, IEEE 802.11p and mmWave
Qitu Hu; Celimuge Wu; Xiaobing Zhao; Xianfu Chen; Yusheng Ji; Tsutomu Yoshinaga
IEEE Access, Institute of Electrical and Electronics Engineers Inc., 6巻, 1号, 掲載ページ 1995-2004, 出版日 2017年12月07日, 査読付, With the rapid increase of vehicular Internet of things applications, it is urgent to design a mobile edge computing architecture, which is possible to distribute and process a large amount of contents with vehicles on the road. From a communication perspective, the current cellular technology faces challenges due to the limited bandwidth in a dense vehicle environment. In this paper, we propose a multi-access edge computing framework and the corresponding communication protocol which integrates licensed Sub-6 GHz band, IEEE 802.11p, and millimeter wave (mmWave) communications for the content distribution and processing in vehicular networks. The proposed protocol uses a cluster-based approach, where a fuzzy logic-based algorithm is employed to select efficient gateway nodes which bridge the licensed Sub-6 GHz communication and the mmWave communication in order to maximize the overall network throughput. IEEE 802.11p vehicle-to-vehicle communication is used to share information among vehicles in order to achieve efficient clustering. We conduct extensive simulations to evaluate the performance of the proposed protocol under various network conditions. Simulation results show that the proposed protocol can achieve significant improvements in various scenarios compared with the existing approaches.
研究論文(学術雑誌), 英語 - Cooperative Content Delivery in Vehicular Networks with Integration of Sub-6 GHz and mmWave
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Proc. of the IEEE Global Communications Conference Workshops, IEEE, 掲載ページ 6 pages, 出版日 2017年12月04日, 査読付
研究論文(国際会議プロシーディングス), 英語 - Pipelined parallel join and its FPGA-based acceleration
Masato Yoshimi; Yasin Oge; Tsutomu Yoshinaga
ACM Transactions on Reconfigurable Technology and Systems, Association for Computing Machinery, 10巻, 4号, 掲載ページ 28:1-28:8, 出版日 2017年12月01日, 査読付, A huge amount of data is being generated and accumulated in data centers, which leads to an important increase in the required energy consumption to analyze these data. Thus, we must consider the redesign of current computer systems architectures to be more friendly to applications based on distributed algorithms that require a high data transfer rate. Novel computer architectures that introduce dedicated accelerators to enable near-data processing have been discussed and developed for high-speed big-data analysis. In this work, we propose a computer system with an FPGA-based accelerator, namely, interconnected-FPGAs, which offers two advantages: (1) direct data transmission and (2) offloading computation into data-flow in the FPGA. In this article, we demonstrate the capability of the proposed interconnected-FPGAs system to accelerate join operations in a relational database. We developed a newparallel join algorithm, PPJoin, targeted to big-data analysis in a shared-nothing architecture. PPJoin is an extended version of the NUMA-based parallel join algorithm, created by overlapping computation by multicore processors and data communication. The data communication between computational nodes can be accelerated by direct data transmission without passing through the main memory of the hosts. To confirm the performance of the PPJoin algorithm and its acceleration process using an interconnected-FPGA platform, we evaluated a simple query for large tables. Additionally, to support availability, we also evaluated the actual benchmark query. Our evaluation results confirm that the PPJoin algorithm is faster than a software-based query engine by 1.5-5 times. Moreover, we experimentally confirmed that the direct data transmission by interconnected FPGAs reduces computational time around 20% for PPJoin. 2017 Copyright is held by the owner/author(s).
研究論文(学術雑誌), 英語 - Color-Based Cooperative Cache and Its Routing Scheme for Telco-CDNs
Takuma Nakajima; Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E100D巻, 12号, 掲載ページ 2847-2856, 出版日 2017年12月, 査読付, Cooperative caching is a key technique to reduce rapid growing video-on-demand's traffic by aggregating multiple cache storages. Existing strategies periodically calculate a sub-optimal allocation of the content caches in the network. Although such technique could reduce the generated traffic between servers, it comes with the cost of a large computational overhead. This overhead will be the cause of preventing these caches from following the rapid change in the access pattern. In this paper, we propose a light-weight scheme for cooperative caching by grouping contents and servers with color tags. In our proposal, we associate servers and caches through a color tag, with the aim to increase the effective cache capacity by storing different contents among servers. In addition to the color tags, we propose a novel hybrid caching scheme that divides its storage area into colored LFU (Least Frequently Used) and no-color LRU (Least Recently Used) areas. The colored LFU area stores color-matching contents to increase cache hit rate and no-color LRU area follows rapid changes in access patterns by storing popular contents regardless of their tags. On the top of the proposed architecture, we also present a new routing algorithm that takes benefit of the color tags information to reduce the traffic by fetching cached contents from the nearest server. Evaluation results, using a backbone network topology, showed that our color-tag based caching scheme could achieve a performance close to the sub-optimal one obtained with a genetic algorithm calculation, with only a few seconds of computational overhead. Furthermore, the proposed hybrid caching could limit the degradation of hit rate from 13.9% in conventional non-colored LFU, to only 2.3%, which proves the capability of our scheme to follow rapid insertions of new popular contents. Finally, the color-based routing scheme could reduce the traffic by up to 31.9% when compared with the shortest-path routing.
研究論文(学術雑誌), 英語 - A Light-weight Cooperative Caching Strategy by D2D Content Sharing
Takayuki Shiroma; Takuma Nakajima; Celumuge Wu; Tsutomu Yoshinaga
Proc. of the Fifth International Symposium on Computing and Networking (CANDAR 2017), IEEE, 掲載ページ 159-165, 出版日 2017年11月20日, 査読付
研究論文(国際会議プロシーディングス), 英語 - V2R Communication Protocol Based on Game Theory Inspired Clustering
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
Proc. of IEEE 86th Vehicular Technology Conference (VTC2017-Fall), 掲載ページ 1-5, 出版日 2017年09月24日, 査読付
研究論文(国際会議プロシーディングス), 英語 - Scalable Photonic Networks-on-Chip Architecture Based on a Novel Wavelength-Shifting Mechanism
A. Ben Ahmed; Tsutomu Yoshinaga; A. Ben Abdallah
IEEE Transactions on Emerging Topics in Computing (April-June 2020), IEEE, 8巻, 2号, 掲載ページ 533-544, 出版日 2017年08月09日, 査読付, We propose in this paper an alternative to these two conventional PNoC architectures. Our proposed system is based on a novel Wavelength-Shifting mechanism, which combines the benefits of the previously mentioned schemes while limiting their drawbacks.
研究論文(学術雑誌), 英語 - A Reinforcement Learning-Based Data Storage Scheme for Vehicular Ad Hoc Networks
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Tutomu Murase; Yan Zhang
IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 66巻, 7号, 掲載ページ 6336-6348, 出版日 2017年07月, 査読付, Vehicular ad hoc networks (VANETs) have been attracting interest for their potential roles in intelligent transport systems (ITS). In order to enable distributed ITS, there is a need to maintain some information in the vehicular networks without the support of any infrastructure such as road side units. In this paper, we propose a protocol that can store the data in VANETs by transferring data to a new carrier (vehicle) before the current data carrier is moving out of a specified region. For the next data carrier node selection, the protocol employs fuzzy logic to evaluate instant reward by taking into account multiple metrics, specifically throughput, vehicle velocity, and bandwidth efficiency. In addition, a reinforcement learning-based algorithm is used to consider the future reward of a decision. For the data collection, the protocol uses a cluster-based forwarding approach to improve the efficiency of wireless resource utilization. We use theoretical analysis and computer simulations to evaluate the proposed protocol.
研究論文(学術雑誌), 英語 - DTN-based Vehicular Cloud for Post-disaster Information Sharing
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
2017 WIRELESS DAYS, IEEE, 掲載ページ 167-172, 出版日 2017年, 査読付, We first propose a framework which utilizes vehicular delay tolerant network (DTN) to form a vehicular cloud in order to provide information exchange without communication infrastructure. The framework does not rely on cellular network and therefore provides an approach which is suitable for post-disaster communication where cellular network is unavailable or severely congested. The paper also proposes a protocol which is able to provide vehicle-to-cloud communication in frequently changing vehicular environment. The protocol takes into account the link throughput, additional signal coverage, connection time, and the probability to encounter a RSU for the forwarder selection by using a fuzzy logic-based approach. The protocol also employs a network coding approach to reduce the overhead while maintaining a high data delivery ratio. We use computer simulations to evaluate the proposed framework.
研究論文(国際会議プロシーディングス), 英語 - Multihop Data Delivery Virtualization for Green Decentralized IoT
Lifeng Zhang; Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Tutomu Murase; Yusheng Ji
Wireless Communications and Mobile Computing, Hindawi Limited, 2017巻, 9805784号, 掲載ページ 9 pages, 出版日 2017年, 査読付, Decentralized communication technologies (i.e., ad hoc networks) provide more opportunities for emerging wireless Internet of Things (IoT) due to the flexibility and expandability of distributed architecture. However, the performance degradation of wireless communications with the increase of the number of hops becomes the main obstacle in the development of decentralized wireless IoT systems. The main challenges come from the difficulty in designing a resource and energy efficient multihop communication protocol. Transmission control protocol (TCP), the most frequently used transport layer protocol for achieving reliable end-to-end communications, cannot achieve a satisfactory result in multihop wireless scenarios as it uses end-to-end acknowledgment which could not work well in a lossy scenario. In this paper, we propose a multihop data delivery virtualization approach which uses multiple one-hop reliable transmissions to perform multihop data transmissions. Since the proposed protocol utilizes hop-by-hop acknowledgment instead of end-to-end feedback, the congestion window size at each TCP sender node is not affected by the number of hops between the source node and the destination node. The proposed protocol can provide a significantly higher throughput and shorter transmission time as compared to the end-to-end approach. We conduct real-world experiments as well as computer simulations to show the performance gain from our proposed protocol.
研究論文(学術雑誌), 英語 - Context-aware Unified Routing for VANETs Based on Virtual Clustering
Celimuge Wu; Tsutomu Yoshinaga; Yusheng J
Proc. of the 2nd International Workshop on Vehicular Networking and Intelligent Transportation systems (VENITS'16), 掲載ページ 281-286, 出版日 2016年09月04日, 査読付, We propose a context-aware routing protocol for vehicular ad hoc networks (VANETs).
研究論文(国際会議プロシーディングス), 英語 - A Cooperative Forwarding Scheme for VANET Routing Protocols
Celimuge Wu; Yusheng Ji; Tsutomu Yoshinaga
ZTE Communications, Editorial Office of ZTE Communications, 14巻, 3号, 掲載ページ 13-21, 出版日 2016年08月25日, 査読付, In this paper, we propose a loss-tolerant scheme for unicast routing protocols in VANETs. The proposed scheme employs multiple forwarding nodes to improve the packet reception ratio at the forwarding nodes. T
研究論文(学術雑誌), 英語 - Accelerating BLAST Computation on an FPGA-enhanced PC Cluster
Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
2016 FOURTH INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 掲載ページ 67-76, 出版日 2016年, 査読付, This paper introduces an FPGA-based scheme to accelerate mpiBLAST, which is a parallel sequence alignment algorithm for computational biology. Recent rapidly growing biological databases for sequence alignment require high-throughput storage and network rather than computing speed. Our scheme utilizes a specialized hardware configured on an FPGA-board which connects flash storage and other FPGA-boards directly. The specialized hardware configured on the FPGAs, we call a Data Stream Processing Engine (DSPE), take a role for preprocessing to adjust data for high-performance multi-and many-core processors simultaneously with offloading system-calls for storage access and networking. DSPE along the datapath achieves in-datapath computing which applies operations for data streams passing through the FPGA. Two functions in mpiBLAST are implemented using DSPE to offload operations along the datapath. The first function is database partitioning, which distributes the biological database to multiple computing nodes before commencing the BLAST processes. Using DSPE, we observe a 20-fold improvement in computation time for the database partitioning operation. The second function is an early part of the BLAST process that determines the positions of sequences for more detailed computations. We implement IDP-BLAST (In-datapath BLAST), which annotates positions in data streams from solid-state drives. We show that IDP-BLAST accelerates the computation time of the preprocess of BLAST by a factor of three hundred by offloading heavy operations to the introduced special hardware.
研究論文(国際会議プロシーディングス), 英語 - A Light-weight Content Distribution Scheme for Cooperative Caching in Telco-CDNs
Takuma Nakajima; Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
2016 FOURTH INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 掲載ページ 126-132, 出版日 2016年, 査読付, A key technique to reduce the rapid growing of video-on-demand's traffic is a cooperative caching strategy aggregating multiple cache storages. Many internet service providers have considered the use of cache servers on their networks as a solution to reduce the traffic. Existing schemes often periodically calculate a sub-optimal allocation of the content caches in the network. However, such approaches require a large computational overhead that cannot be amortized in a presence of frequent changes of the contents' popularities. This paper proposes a light-weight scheme for a cooperative caching that obtains a sub-optimal distribution of the contents by focusing on their popularities. This was made possible by adding color tags to both cache servers and contents. In addition, we propose a hybrid caching strategy based on Least Frequently Used (LFU) and Least Recently Used (LRU) schemes, which efficiently manages the contents even with a frequent change in the popularity. Evaluation results showed that our light-weight scheme could considerably reduce the traffic, reaching a sub-optimal result. In addition, the performance gain is obtained with a computation overhead of just a few seconds. The evaluation results also showed that the hybrid caching strategy could follow the rapid variation of the popularity. While a single LFU strategy drops the hit ratio by 13.9%, affected by rapid popularity changes, our proposed hybrid strategy could limit the degradation to only 2.3%.
研究論文(国際会議プロシーディングス), 英語 - Design and Evaluation of a Configurable Query Processing Hardware for Data Streams
Yasin Oge; Masato Yoshimi; Takefumi Miyoshi; Hideyuki Kawashima; Hidetsugu Irie; Tsutomu Yoshinaga
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E98D巻, 12号, 掲載ページ 2207-2217, 出版日 2015年12月, 査読付, In this paper, we propose Configurable Query Processing Hardware (CQPH), an FPGA-based accelerator for continuous query processing over data streams. CQPH is a highly optimized and minimal-overhead execution engine designed to deliver real-time response for high-volume data streams. Unlike most of the other FPGA-based approaches, CQPH provides on-the-fly configurability for multiple queries with its own dynamic configuration mechanism. With a dedicated query compiler, SQL-like queries can be easily configured into CQPH at run time. CQPH supports continuous queries including selection, group-by operation and sliding-window aggregation with a large number of overlapping sliding windows. As a proof of concept, a prototype of CQPH is implemented on an FPGA platform for a case study. Evaluation results indicate that a given query can be configured within just a few microseconds, and the prototype implementation of CQPH can process over 150 million tuples per second with a latency of less than a microsecond. Results also indicate that CQPH provides linear scalability to increase its flexibility (i.e., on-the-fly configurability) without sacrificing performance (i.e., maximum allowable clock speed).
研究論文(学術雑誌), 英語 - クラウド環境における計算資源の動的共有手法の提案と評価
中島拓真; 吉見真聡; 入江英嗣; 吉永努
電子情報通信学会論文誌D, 電子情報通信学会, J98-D巻, 8号, 掲載ページ 1142-1150, 出版日 2015年08月05日, 査読付
研究論文(学術雑誌), 日本語 - An Efficient Cache Grouping Strategy for Multinode Cache Networks
Takayuki Shiroma; Takuma Nakajima; Kouta Nojima; Masato Yoshimi; Tsutomu Yoshinaga
PROCEEDINGS OF 2015 THIRD INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 掲載ページ 295-298, 出版日 2015年, 査読付, Popularizations of Video-On-Demand (VOD) services cause explosive and continuous growth of the Internet traffic. Web cache servers are widely utilized fot reducing such VOD traffic. However, ordinary cache strategies such as LRU often degrade cache efficiency of a multi-node cache network as popular contents are cached on all servers that squeezes the total amount of cache capacity. This paper proposes a novel strategy called Cache Grouping to improve cache efficiency in the multi-node cache network. The Cache Grouping organizes multiple web cache servers into a single cache server to increase virtual cache capacity and diversity of stored contents. Compared to a conventional cache strategy, the Cache Grouping reduces maximum 59% of web server transmissions and improves 20% of download time to process all requests while maintaining a total amount of transmissions.
研究論文(国際会議プロシーディングス), 英語 - Packet Size-Aware Broadcasting in VANETs With Fuzzy Logic and RL-Based Parameter Adaptation
Celimuge Wu; Xianfu Chen; Yusheng Ji; Fuqiang Liu; Satoshi Ohzahata; Tsutomu Yoshinaga; Toshihiko Kato
IEEE ACCESS, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 3巻, 掲載ページ 2481-2491, 出版日 2015年, 査読付, Most existing multi-hop broadcast protocols for vehicular ad hoc networks do not consider the problem of how to adapt transmission parameters according to the network environment. Besides the propagation environment that determines the channel bit error rate, packet payload size has a significant effect on the packet loss rate. In this paper, we first discuss the effect of packet size on the packet reception ratio, and then propose a broadcast protocol that is able to specify the best relay node by taking into account the data payload size. The proposed protocol employs a fuzzy logic-based algorithm to jointly consider multiple metrics (link quality, inter-vehicle distance, and vehicle mobility) and uses a redundancy transmission approach to ensure high reliability. Since the fuzzy membership functions are tuned by using reinforcement learning, the protocol can adapt to various network scenarios. We use both real-world experiments and computer simulations to evaluate the proposed protocol.
研究論文(学術雑誌), 英語 - UDU-L:レーザポインティングによる柔軟なデバイス接続手法
小木 真人; 大木 裕太; 吉永 努; 入江 英嗣
電子情報通信学会論文誌, 一般社団法人電子情報通信学会, Vol. J97-D巻, No.1号, 掲載ページ 155-164, 出版日 2014年01月, 査読付, ネットワークに接続できるデバイスが普及し,各々のデバイスがもつデータや機能をネットワーク上で共有するデバイス連携が増加している.しかし,既存技術によるデバイス接続では,対象デバイスをネットワーク上からユーザが手動で選択する必要があり,デバイス同士が物理的に近くにあっても,通信したいと思ったときにその場で接続を行うことは煩雑である.そこで,通信対象のデバイスに対して直観的に接続する方法として,レーザを利用した接続方法UDU-Lを提案する.UDU-Lは,可視光レーザを用いレーザポインタのように通信したいデバイスを直接指定する.このとき,レーザ光の明滅によって,対象デバイスへ接続に必要な情報を送信し通信を確立する.実装の結果,5m離れた対象デバイスを正確に指定して通信を行うことができた.また応用例として,手元の携帯端末内の画像をディスプレイへ転送・表示するアプリケーションを実装した.
研究論文(学術雑誌), 日本語 - An FPGA-based Tightly Coupled Accelerator for Data-intensive Applications
Masato Yoshimi; Ryu Kudo; Yasin Oge; Yuta Terada; Hidetsugu Irie; Tsutomu Yoshinaga
2014 IEEE 8TH INTERNATIONAL SYMPOSIUM ON EMBEDDED MULTICORE/MANYCORE SOCS (MCSOC), IEEE, 掲載ページ 289-296, 出版日 2014年, 査読付, Computation beside a data source plays an important role in achieving a high performance with low energy consumption in Big Data processing. In contrast to that of a conventional workload, the processing of Big Data frequently requires that a massive amount of data in distributed storage be scanned. A key technique for reducing energy-consuming processor loads is to install a reconfigurable accelerator that is tightly coupled to a computational resource with interfaces. The accelerator is capable of configuring application-specific hardware modules to allow some logical and arithmetic operations for data stream transmission between interfaces, as well as the offloading of control protocols for communication with other computing nodes or storage. In this paper, an FPGA-based accelerator, which is directly attached to DRAM, the network, and storage, is proposed in order to realize an energy efficient computing system. A simple application that counts the words appearing in the data is implemented to evaluate a prototype system. As the accelerator outperforms by 80.66 to 429 times similar applications executed on an SSD-based Hadoop framework, we confirm that the accelerator's utilization for Big Data processing is beneficial.
研究論文(国際会議プロシーディングス), 英語 - Accelerating OLAP workload on interconnected FPGAs with Flash storage
Masato Yoshimi; Ryu Kudo; Yasin Oge; Yuta Terada; Hidetsugu Irie; Tsutomu Yoshinaga
2014 SECOND INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 掲載ページ 440-446, 出版日 2014年, 査読付, The data volume used in online analytical processing (OLAP) applications is rapidly increasing because of the increasing popularity of various Web services and emerging sensor technologies. Since the amount of accumulated data is frequently too large to store in an in-memory database, it is necessary to have a secondary storage to store such big data. On the basis of this premise, the most important factor to determine the performance of data-intensive applications is to reduce the number and the size of the data transfers between the secondary storage and the main memory. To achieve an energy-efficient computing environment, offloading a user-defined function (UDF) onto interconnected FPGA-boards that equip high-speed storage is effective due to FPGA's performance ratio of operations per I/O. In this paper, we focus on the aggregate operations that are popularly used UDF in OLAP, and propose an acceleration scheme utilizing interconnected FPGAs with flash storage. The scheme is by introducing an accelerator modules which apply operations to data-stream passing through the FPGA, in addition to appropriate data distribution and partitioning. We implemented an accelerator module that aggregates the data transferred from the flash storage to the DRAM in order to show availability. Through preliminary evaluations of the accelerator, we confirmed that aggregate operations supported by the active-disk mechanism outperforms a software-based database management system by more than 30 times.
研究論文(国際会議プロシーディングス), 英語 - A Fully Optical Ring Network-on-Chip with Static and Dynamic Wavelength Allocation
Ahmadou Dit Adi Cisse; Michihiro Koibuchi; Masato Yoshimi; Hidetsugu Irie; Tsutomu Yoshinaga
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E96D巻, 12号, 掲載ページ 2545-2554, 出版日 2013年12月, 査読付, Silicon photonics Network-on-Chips (NoCs) have emerged as an attractive solution to alleviate the high power consumption of traditional electronic interconnects. In this paper, we propose a fully optical ring NoC that combines static and dynamic wavelength allocation communication mechanisms. A different wavelength-channel is statically allocated to each destination node for light weight communication. Contention of simultaneous communication requests from multiple source nodes to the destination is solved by a token based arbitration for the particular wavelength-channel. For heavy load communication, a multiwavelength-channel is available by requesting it in execution time from source node to a special node that manages dynamic allocation of the shared multiwavelength-channel among all nodes. We combine these static and dynamic communication mechanisms in a same network that introduces selection techniques based on message size and congestion information. Using a photonic NoC simulator based on Phoenixsim, we evaluate our architecture under uniform random, neighbor, and hotspot traffic patterns. Simulation results show that our proposed fully optical ring NoC presents a good performance by utilizing adequate static and dynamic channels based on the selection techniques. We also show that our architecture can reduce by more than half, the energy consumption necessary for arbitration compared to hybrid photonic ring and mesh NoCs. A comparison with several previous works in term of architecture hardware cost shows that our architecture can be an attractive cost-performance efficient interconnection infrastructure for future SoCs and CMPs.
研究論文(学術雑誌), 英語 - FLAT: MPIを埋め込み可能なGPUプログラミングフレームワーク
島圭吾; 吉見真聡; 三好健文; 近藤正章; 入江英嗣; 本多弘樹; 吉永努
情報処理学会論文誌コンピューティングシステム, 6巻, 4号, 掲載ページ 105-116, 出版日 2013年10月, 査読付, GPU搭載PCクラスタで動作するプログラムは,GPU上の処理を記述するコードと通信処理を行うCPUのコードで構成される.GPUコードは並列化されたアルゴリズムを高速に実行し,CPUはノード間の通信処理を担当する.ノード間通信にはMPIの利用が一般的だがGPUコードには記述できないため,並列化の効果を引き出すためには,プログラマはCPUとGPUのデータの移動を考えつつCPUコードとGPUコードを並行して実装することになる.そこで,GPU間のデータ通信に関わるプログラミングコストを低減させるために,MPIを埋め込み可能なGPUプログラミングフレームワーク"FLAT"を提案する.FLATを用いることでGPUコードにMPI関数が記述できるようになるため,GPU間で転送されるデータが明確化される.本論文では,まず,FLATの実行モデルと実装方法について述べる.その後,LivermoreループLoop18,オプティカルフロー計算の2つの実プログラムを用いてFLATの有効性と実行性能を示す.実験の結果,GPUコードの計算粒度が粗粒度の場合,FLATの利用による性能低下率は,3%以下であることが確認された.A program for a PC cluster which equips GPUs consists of two types of code, for GPUs and for CPUs. The GPU code executes parallelized algorithms to introduce high speed computing supported by a CPU code which performs communication with other nodes. Although MPI library is commonly utilized to transfer data in the CPU code, MPI functions can not be written in the GPU code. Programmers are forced to implement CPU and GPU codes alternately with taking care of data movement among nodes. In order to reduce software development costs, we propose a programming framework called FLAT which enables GPU codes to embed MPI functions. This paper describes execution model and implementation of FLAT, and discusses availability and performance obtained by two case studies, Livermore Loop18 and optical flow programs. Through the experimental results, we confirmed that FLAT increases readability in synthesized GPU codes with maintaining bearable performance degradation, which is less than 3% for a coarse-grained parallel program.
研究論文(学術雑誌), 日本語 - 配線アクティビティを考慮した3次元積層プロセッサ向けフロアプランナー
入江英嗣; 稲場朋大; 放地宏佳; 藤原大輔; 眞島一貴; 吉見真聡; 吉永努
情報処理学会ACS論文誌, 情報処理学会, 6巻, 3号, 掲載ページ 131-145, 出版日 2013年09月25日, 査読付, 本研究では,パイプラインシミュレータと連携して,モジュール間の通信頻度を考慮する3次元モジュールマッパを提案し,3次元プロセッサのフロアプランおよびそのアーキテクチャへの影響を明らかにする.提案モジュールマッパの出力結果からは,3次元構造を利用した効率的なデータパスやキャッシュ配置が確認された.3層,TSVの配線容量を30μmの通常配線と同等と仮定したときのフロアプランでは,2次元実装に比べて面積を34%,ロングワイヤ電力の近似値である配線アクティビティ値を57%まで削減し,従来のフロアプランナによる3次元実装に対して10%の配線アクティビティ値削減となった.
研究論文(学術雑誌), 日本語 - Variable Color Environment System using Heart Rate Variability
Naoko Kanda; Daiki Sakuma; Masato Yoshimi; Tsutomu Yoshinaga; Hidetugu Irie
Proc. of the 2013 International Conference on Bioinformatics & Computational Biology (BIOCOMP'13), 掲載ページ 1-BIOCOMP-6, 出版日 2013年07月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Wire-speed implementation of sliding-window aggregate operator over out-of-order data streams
Yasin Oge; Masato Yoshimi; Takefumi Miyoshi; Hideyuki Kawashima; Hidetsugu Irie; Tsutomu Yoshinaga
Proceedings - IEEE 7th International Symposium on Embedded Multicore/Manycore System-on-Chip, MCSoC 2013, IEEE Computer Society, 掲載ページ 55-60, 出版日 2013年, 査読付, This paper shows the design and evaluation of an FPGA-based accelerator for sliding-window aggregation over data streams with out-of-order data arrival. We propose an order-agnostic hardware implementation technique for windowing operators based on a one-pass query evaluation strategy called Window-ID, which is originally proposed for software implementation. The proposed implementation succeeds to process out-of-order data items, or tuples, at wire speed due to the simultaneous evaluations of overlapping sliding-windows. In order to verify the effectiveness of the proposed approach, we have also implemented an experimental system as a case study. Our experiments demonstrate that the proposed accelerator with a network interface achieves an effective throughput around 760 Mbps or equivalently nearly 6 million tuples per second, by fully utilizing the available bandwidth of the network interface. © 2013 IEEE.
研究論文(国際会議プロシーディングス), 英語 - An Efficient and Scalable Implementation of Sliding-Window Aggregate Operator on FPGA
Yasin Oge; Masato Yoshimi; Takefumi Miyoshi; Hideyuki Kawashima; Hidetsugu Irie; Tsutomu Yoshinaga
2013 FIRST INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 掲載ページ 112-121, 出版日 2013年, 査読付, This paper presents an efficient and scalable implementation of an FPGA-based accelerator for sliding-window aggregates over disordered data streams. With an increasing number of overlapping sliding-windows, the window aggregates have a serious scalability issue, especially when it comes to implementing them in parallel processing hardware (e.g., FPGAs). To address the issue, we propose a resource-efficient, scalable, and order-agnostic hardware design and its implementation by examining and integrating two key concepts, called Window-ID and Pane, which are originally proposed for software implementation, respectively. Evaluation results show that the proposed implementation scales well compared to the previous FPGA implementation in terms of both resource consumption and performance. The proposed design is fully pipelined and our implementation can process out-of-order data items, or tuples, at wire speed up to 200 million tuples per second.
研究論文(国際会議プロシーディングス), 英語 - A real-time gait improvement tool using a smartphone
Hirotaka Kashihara; Hiroki Shimizu; Hiroyoshi Houchi; Masato Yoshimi; Tsutomu Yoshinaga; Hidetsugu Irie
ACM International Conference Proceeding Series, 掲載ページ 243, 出版日 2013年, 査読付, Recent handy devices are provided with various sensors and have realized a lot of functions as downsizing and speeding up of computers. Currently smartphones occupy significant positions as the multifunctional handy devices. One of the most observable feature is that the users carry the smartphone whenever leaving home. Analyzing the motion measured by such device can be useful to improve lifestyle habits. Gaits should be focused as the representative behavior of daily living, which is shown by the fact that there are a lot of exercises intended to improve gaits. Copyright 2013 ACM.
研究論文(国際会議プロシーディングス), 英語 - A fast handshake join implementation on FPGA with adaptive merging network
Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
ACM International Conference Proceeding Series, 掲載ページ No.44 (4 pages), 出版日 2013年, 査読付, One of a critical design issues for implementing handshake-join hardware is result collection performed by a merging network. To address the issue, we introduce an adaptive merging network. Our implementation achieves over 3 million tuples per second when the selectivity is 0.1. The proposed implementation attains up to 5.2x higher throughput than original handshake-join hardware. In this demonstration, we apply the proposed technique to filter out malicious packets from packet streams. To the best of our knowledge, our system is the fastest handshake join implementation on FPGA. Copyright © 2013 ACM.
研究論文(国際会議プロシーディングス), 英語 - Sharing Computing Resources with Virtual Machines by Transparent Data Access
Takuma Nakajima; Masato Yoshimi; Hidetsugu Irie; Tsutomu Yoshinaga
2013 FIRST INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 掲載ページ 359-365, 出版日 2013年, 査読付, Cloud computing has rapid growth in enterprise and academic areas. Computing platform makes up the transition from physical servers to virtual machines (VMs) in the cloud. Instead of many advantages, VMs remain several problems to employ effective utilization of physical computing resources, especially many-core accelerators. Even though GPGPU is a hopeful solution for high-load applications, existing methods to utilize GPUs from VMs are subjected to various restraints. In order to solve this problem, we propose a flexible method to share external computing resources by providing transparent access for data in the VMs. By committing commands to a computing host which processes the jobs as substitution, VMs can process high load jobs as necessary even if the VM has a tiny configuration. The computing host mounts the working directories in the VMs and enqueues jobs committed by the VMs. Experimental results show that the overhead of our implementation is sufficiently small in the low I/O load processes.
研究論文(国際会議プロシーディングス), 英語 - Using Cacheline Reuse Characteristics for Prefetcher Throttling
Hidetsugu Irie; Takefumi Miyoshi; Goki Honjo; Kei Hiraki; Tsutomu Yoshinaga
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E95D巻, 12号, 掲載ページ 2928-2938, 出版日 2012年12月, 査読付, One of the significant issues of processor architecture is to overcome memory latency. Prefetching can greatly improve cache performance, but it has the drawback of cache pollution, unless its aggressiveness is properly set. Several techniques that have been proposed for prefetcher throttling use accuracy as a metric, but their robustness were not sufficient because of the variations in programs' working set sizes and cache capacities. In this study, we revisit prefetcher throttling from the viewpoint of data lifetime. Exploiting the characteristics of cache line reuse, we propose Cache-Convection-Control-based Prefetch Optimization Plus (CCCPO+), which enhances the feedback algorithm of our previous CCCPO. Evaluation results showed that this novel approach achieved a 30% improvement over no prefetching in the geometric mean of the SPEC CPU 2006 benchmark suite with 256 KB LLC, 1.8% over the latest prefetcher throttling, and 0.5% over our previous CCCPO. Moreover, it showed superior stability compared to related works, while lowering the hardware cost.
研究論文(学術雑誌), 英語 - Design and Implementation of a Handshake Join Architecture on FPGA
Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E95D巻, 12号, 掲載ページ 2919-2927, 出版日 2012年12月, 査読付, A novel design is proposed to implement highly parallel stream join operators on a field-programmable gate array (FPGA), by examining handshake join algorithm for hardware implementation. The proposed design is evaluated in terms of the hardware resource usage, the maximum clock frequency, and the performance. Experimental results indicate that the proposed implementation can handle considerably high input rates, especially at low match rates. Results of simulation conducted to optimize size of buffers included in join and merge units give a new intuition regarding static and adaptive buffer tuning in handshake join.
研究論文(学術雑誌), 英語 - A Token-based Fully Photonic Network-on-Chip with Dynamic Wavelength Allocation
P. Qiu; C.A.D. Adi; H. Irie; T. Yoshinaga
Proc. of the International Workshop on Modern Science and Technology (IWMST 2012), 掲載ページ 39-44, 出版日 2012年08月
研究論文(国際会議プロシーディングス), 英語 - FLAT: A GPU programming framework to provide embedded MPI
Takefumi Miyoshi; Hidetsugu Irie; Keigo Shima; Hiroki Honda; Masaaki Kondo; Tsutomu Yoshinaga
ACM International Conference Proceeding Series, 掲載ページ 20-29, 出版日 2012年, 査読付, For leveraging multiple GPUs in a cluster system, it is necessary to assign application tasks to multiple GPUs and execute those tasks with appropriately using communication primitives to handle data transfer among GPUs. In current GPU programming models, communication primitives such as MPI functions cannot be used within GPU kernels. Instead, such functions should be used in the CPU code. Therefore, programmer must handle both GPU kernel and CPU code for data communications. This makes GPU programming and its optimization very difficult. In this paper, we propose a programming framework named FLAT which enables programmers to use MPI functions within GPU kernels. Our framework automatically transforms MPI functions written in a GPU kernel into runtime routines executed on the CPU. The execution model and the implementation of FLAT are described, and the applicability of FLAT in terms of scalability and programmability is discussed. We also evaluate the performance of FLAT. The result shows that FLAT achieves good scalability for intended applications. © 2012 ACM.
研究論文(国際会議プロシーディングス), 英語 - Design and implementation of a merging network architecture for handshake join operator on fpga
Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
Proceedings - IEEE 6th International Symposium on Embedded Multicore SoCs, MCSoC 2012, 掲載ページ 84-91, 出版日 2012年, 査読付, A novel merging network architecture is proposed for a handshake join operator in order to achieve much higher data throughput than ever before. Handshake join is a highly parallelized algorithm for window-based stream joins. Result collection performed by a merging network is a significant design issue for the handshake join operator because the merging network becomes an overwhelming bottleneck for scalable performance. To address the issue, an adaptive merging network is proposed for hardware implementation of the algorithm. The proposed architecture is implemented on an FPGA and it is evaluated in terms of the hardware resource usage, the maximum clock frequency, and the performance. Experimental results demonstrate up to 16.3 times higher throughput than nested loops-style join implementation without dropping any tuples. To the best of our knowledge, this is the best performance for handshake join operator implemented on an FPGA. © 2012 IEEE.
研究論文(国際会議プロシーディングス), 英語 - Parallel Numerical Simulation of Visual Neurons for Analysis of Optical Illusion
Akira Egashira; Shunji Satoh; Hidetsugu Irie; Tsutomu Yoshinaga
2012 THIRD INTERNATIONAL CONFERENCE ON NETWORKING AND COMPUTING (ICNC 2012), IEEE, 掲載ページ 130-136, 出版日 2012年, 査読付, Detailed mechanism of optical illusion caused by visual neurons in human brain has not been well understood, and its numerical simulation is helpful to analyze visual system of humans. This paper describes implementation techniques of parallel numerical simulation to help understanding optical illusion by using a GPU-accelerated PC cluster. Our parallel acceleration techniques include following three points. Firstly, input images of the numerical simulation is efficiently calculated by dividing it images for multiple computation nodes using MPI (Message Passing Interface). Secondly, convolution, which is dominated computation for the optical flow, is accelerated by GPU. Finally, an algorithm to compute convolution specified to analyze optical illusion is proposed to speed up the simulation. Our experimental results show an interesting insight that values of optical flow for images causing optical illusion are quite different compared to that does not cause the optical illusion. We also demonstrate that our implementation of simulation works efficiently on the GPU-accelerated PC cluster.
研究論文(国際会議プロシーディングス), 英語 - STRAIGHT: Realizing a Lightweight Large Instruction Window by using Eventually Consistent Distributed Registers
Hidetsugu Irie; Daisuke Fujiwara; Kazuki Majima; Tsutomu Yoshinaga
2012 THIRD INTERNATIONAL CONFERENCE ON NETWORKING AND COMPUTING (ICNC 2012), IEEE, 掲載ページ 336-342, 出版日 2012年, 査読付, As the number of cores as well as the network size in a processor chip increases, the performance of each core is more critical for the improvement of the total chip performance. However, to improve the total chip performance, the performance per power or per unit area must be improved, making it difficult to adopt a conventional approach of superscalar extension. In this paper, we explore a new core structure that is suitable for manycore processors. We revisit prior studies of new instruction-level (ILP) and thread-level parallelism (TLP) architectures and propose our novel STRAIGHT processor architecture. By introducing the scheme of distributed key-value-store to the register file of clustered microarchitectures, STRAIGHT directly executes the operation with large logical registers, which are written only once. By discussing the processor structure, microarchitecture, and code model, we show that STRAIGHT realizes both large instruction window and lightweight rapid execution, while suppressing the hardware and energy cost. Preliminary estimation results are promising, and show that STRAIGHT improves the single thread performance by about 30%, which is the geometric mean of the SPEC CPU 2006 benchmark suite, without significantly increasing the power and area budget.
研究論文(国際会議プロシーディングス), 英語 - Throttling control for bufferless routing in on-chip networks
Yicheng Guan; Cisse Ahmadou Dit Adi; Takefumi Miyoshi; Michihiro Koibuchi; Hidetsugu Irie; Tsutomu Yoshinaga
Proceedings - IEEE 6th International Symposium on Embedded Multicore SoCs, MCSoC 2012, 掲載ページ 37-44, 出版日 2012年, 査読付, As the number of core integration on a single diegrows, buffers consume significant energy, and occupy chip area. A bufferless deflection routing that eliminates router's inputportbuffers can considerably help saving energy and chip areawhile providing similar performance of existing buffered routing, especially for low-to-medium network loads. However when congestion increases, the bufferless frequently causes flits deflections, and misrouting leading to a degradation of network performance. In this paper, we propose IRT(Injection Rate Throttling), a local throttling mechanism that reduces deflection and misrouting for high-load bufferless networks. IRT provides injection rate control independently for each network node, allowing to reduce network congestion. Our simulation results based on a cycle-accurate simulator show that using IRT, IRT reduces average transmission latency by 8.65% compared to traditional bufferless routing. © 2012 IEEE.
研究論文(国際会議プロシーディングス), 英語 - Computation-Communication Overlap of Linpack on a GPU-Accelerated PC Cluster
Junichi Ohmura; Takefumi Miyoshi; Hidetsugu Irie; Tsutomu Yoshinaga
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E94D巻, 12号, 掲載ページ 2319-2327, 出版日 2011年12月, 査読付, In this paper, we propose an approach to obtaining enhanced performance of the Linpack benchmark on a CPU-accelerated PC cluster connected via relatively slow inter-node connections. For one node with a quad-core Intel Xeon W3520 processor and a NVIDIA Testa C1060 CPU card, we implement a CPU-GPU parallel double-precision general matrix-matrix multiplication (dgemm) operation, and achieve a performance improvement of 34% compared with the CPU-only case and 64% compared with the CPU-only case. For an entire 16-node cluster, each node of which is the same as the above and is connected with two gigabit Ethernet links, we use a computation-communication overlap scheme with CPU acceleration for the Linpack benchmark, and achieve a performance improvement of 28% compared with the CPU-accelerated high-performance Unpack benchmark (HPL) without overlapping. Our overlap CPU acceleration solution uses overlaps in which the main inter-node communication and data transfer to the GPU device memory are overlapped with the main computation task on the CPU cores. These overlaps use multi-core processors, which almost all of today's high-performance computers use. In particular, as well as using a CPU core for communication tasks, we also simultaneously use other CPU cores and the CPU for computation tasks. In order to enable overlap between inter-node communication and computation tasks, we eliminate their close dependence by breaking the main computation task into smaller tasks and rescheduling. Based on a scheme in which part of the CPU computation power is simultaneously used for tasks other than computation tasks, we experimentally find the optimal computation ratio for CPUs; this ratio differs from the case of parallel dgemm operation of one node.
研究論文(学術雑誌), 英語 - ウィンドウ結合演算子の FPGAによる実現
三好健文; 寺田裕太; 川島英之; 吉永努
電子情報通信学会 論文誌B, 一般社団法人電子情報通信学会, J94-B巻, 10号, 掲載ページ 1313-1322, 出版日 2011年10月, 査読付, 本論文では,ストリームデータのウィンドウ結合をFPGA上に実現する手法とアーキテクチャを提案する.提案アーキテクチャは二つのストリームデータの処理を並列に行い,かつそれをパイプライン処理することで高性能化を実現する.提案アーキテクチャは,2^<16>個のタプルに関するウィンドウ結合を実現し,1ms周期で発生するストリームデータを処理できることを示す.高性能化に起因して,出力結果タプルが欠落する問題が生じることを述べ,提案するアドミッション制御機構によりその問題を防ぐことを示す.
研究論文(学術雑誌), 日本語 - ストリーム処理エンジン向け動的再構成可能プロセッサアーキテクチャの設計
三好健文; 寺田裕太; 川島英之; 吉永努
情報処理学会データベーストランザクション, 情報処理学会, 4巻, 2号, 掲載ページ 35-51, 出版日 2011年07月, 査読付, 動的再構成可能ストリーム処理エンジンDR-SPEのプロセッサアーキテクチャを提案する.ストリーム処理エンジンは,ときどき刻々と変化するデータの流れであるストリームデータに対して,SQLライクな宣言的クエリ言語を用いて,関係演算や算術演算を適用できる.DR-SPEは並列処理による高い処理性能を実現すると同時に,高速なクエリ登録や演算子実行順序切換えをサポートする専用ハードウェアによるストリーム処理エンジンである.DR-SPEが提供する演算子は,Streams on Wiresと同等である.本論文では,提案するアーキテクチャをFPGA XC6VLX240T-1上に実装し,クエリの構成時間および処理性能を評価する.評価の結果は,DR-SPEはStreams on Wiresと同等のスループットを実現しながら,85μ秒でクエリを構成できることを示す.A processor architecture of dynamic reconfigurable stream processing engine DR-SPE is proposed. By using declarative query language, stream processing engine is able to apply relational and arithmetic operations to stream data. DR-SPE is a special purpose hardware for stream processing, which achieves both of high processing performance by exploiting parallelism in target query and ability for query registration and execution order of operations at runtime. Available operations in DR-SPE are the same as ones in Streams on Wires. In this paper, DR-SPE is implemented on a FPGA XC6VLX240T-1, and its configuration time for operations and its performance are evaluated in real experiments. The result of experiments shows that DR-SPE realizes 85μ second on configuration of operations, which overwhelms Streams on Wires. Simultaneously, DR-SPE achieves comparable performance with Streams on Wires,
研究論文(学術雑誌), 日本語 - Prediction Router: A Low-Latency On-Chip Router Architecture with Multiple Predictors
Hiroki Matsutani; Michihiro Koibuchi; Hideharu Amano; Tsutomu Yoshinaga
IEEE TRANSACTIONS ON COMPUTERS, IEEE COMPUTER SOC, 60巻, 6号, 掲載ページ 783-799, 出版日 2011年06月, 査読付, Multi and many-core applications are sensitive to interprocessor communication latencies, suggesting the need for low-latency on-chip networks. We propose a low-latency router architecture that predicts the output channel to be used by the next packet transfer and speculatively completes the switch arbitration to reduce communication latency. The packets coming into the prediction routers are transferred without waiting for the routing computation and switch arbitration if the prediction hits. Thus, the primary concern for reducing communication latency is the hit rates of the prediction algorithms, which vary based on network environments, such as the network topology, routing algorithm, and traffic pattern. Although typical low-latency routers that skip one or more pipeline stages use a bypass data path that is based on a static or single bypassing policy ( e. g., accelerating the packets moving in the same dimension), our prediction router architecture predictively forwards packets based on the prediction algorithm selected from among several candidates in response to the network environment. We analyze the prediction hit rates of five prediction algorithms on meshes, tori, fat trees, and Spidergons. Then, we present four case studies, each of which assumes different many-core architectures. We implemented the prediction routers for each case study by using a 45 nm CMOS process, and evaluated them in terms of the prediction hit rate, zero-load latency, hardware amount, and energy consumption. A typical prediction router with two or three predictors shows that although the area and energy are increased by 4.8-12.0 percent and 5.3 percent, respectively, up to 89.8 percent of the prediction hit rate is achieved in real applications, which provides favorable trade-offs between modest hardware/energy overheads and significant latency saving.
研究論文(学術雑誌), 英語 - 仮想リモートレプリケーションによる3拠点ストレージシステム制御方式
牧晋広; 平岩友理; 今津剛行; 吉永努
情報処理学会論文誌, 52巻, 2号, 掲載ページ 1-13, 出版日 2011年02月, 査読付
研究論文(学術雑誌), 日本語 - A coarse grain reconfigurable processor architecture for stream processing engine
Takefumi Miyoshi; Hideyuki Kawashima; Yuta Terada; Tsutomu Yoshinaga
Proceedings - 21st International Conference on Field Programmable Logic and Applications, FPL 2011, 掲載ページ 490-495, 出版日 2011年, 査読付, This paper proposes a processor architecture for DR-SPE, a dynamic reconfigurable stream processing engine. DR-SPE is special-purpose hardware for stream data processing, which achieves high processing performance by exploiting parallelism in the target query. It also handles query registration and execution order of operations at runtime. Available operations in DR-SPE are the same as those in Streams on Wires. In this paper, DR-SPE is implemented on a FPGA XC6VLX240T-1, and its performance is evaluated. The results of the evaluation show that DR-SPE achieves register modification within 506 μsec when the configuration path is driven at 1 Mbps, which is not achieved by Streams on Wires. DR-SPE also achieves flexibility and can support complicated queries by providing 10×10 operation units tiled onto an FPGA. DR-SPE achieves comparable operation throughput with Streams on Wires at the expense of requiring more LUTs. © 2011 IEEE.
研究論文(国際会議プロシーディングス), 英語 - Multi-GPU acceleration of optical flow computation in visual functional simulation
Junichi Ohmura; Akira Egashira; Shunji Satoh; Takefumi Miyoshi; Hidetsugu Irie; Tsutomu Yoshinaga
Proceedings - 2011 2nd International Conference on Networking and Computing, ICNC 2011, 掲載ページ 228-234, 出版日 2011年, 査読付, Numerical simulation for visual processing of the human brain is one of time-consuming applications. This paper shows acceleration techniques for a simulation program of the visual processing. We parallelize convolution calculations, which are core operations, which the simulation program requests, on a GPU-accelerated PC cluster. Our implementation includes three improvement points. Firstly, we consider efficient data mapping onto global and shared memories1 of the GPU. Secondly, multiple convolutions for the same input data are computed by each node's GPU, referred to as package execution. Finally, an input 2-dimensional image is divided into regions and convolutions for these regions are executed in parallel utilizing MPI (Message Passing Interface). Our experimental results show a linear speedup up to 12 nodes in the PC cluster for the convolution program. We also show the effects of the package execution and reduced communication on NVIDIA tesla C1060 and C2070, respectively. © 2011 IEEE.
研究論文(国際会議プロシーディングス), 英語 - CCCPO: Robust prefetcher optimization technique based on cache convection
Hidetsugu Irie; Takefumi Miyoshi; Goki Honjo; Kei Hiraki; Tsutomu Yoshinaga
Proceedings - 2011 2nd International Conference on Networking and Computing, ICNC 2011, 掲載ページ 127-133, 出版日 2011年, 査読付, One of the significant issues of processor architecture is to overcome memory latency. Prefetching can greatly improve cache performance, however, it has the drawback of cache pollution unless its aggressiveness is properly set. Although several techniques for prefetcher throttling have been proposed which use accuracy as a metric, their robustness were not sufficient due to the variations between program working set sizes and cache capacities. In this paper, we revisit cache behavior with the viwepoint of data lifetime in a cache with prefetching. Based on this observation Cache-Convection-Control-based Prefetch Optimization (CCCPO) is proposed, which exploits the characteristics of cache line reuse and controls the prefetcher aggressiveness. Evaluation results showed that this novel approach achieved 4.6% improvement against the most recent prefetcher throttling algorithms in the geometric mean of SPEC CPU 2006 benchmark suite with 256KB LLC. © 2011 IEEE.
研究論文(国際会議プロシーディングス), 英語 - An implementation of handshake join on FPGA
Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
Proceedings - 2011 2nd International Conference on Networking and Computing, ICNC 2011, 掲載ページ 95-104, 出版日 2011年, 査読付, This paper shows an implementation of handshake join on field-programmable gate array (FPGA). Handshake join is one of stream join algorithms, proposed by Teubner and Mueller. It can support very high degrees of parallelism and attain unprecedented success in throughput speed in order to achieve efficient support for window-based join in streaming databases. In handshake join, it is necessary to take into account the problems with regard to the capacity of the output channel and the limitation of the internal buffer sizes, in order to apply join operation to input tuples efficiently in a correct manner. However, the implementation has not necessarily clarified in detail yet in their paper. In this paper, to solve the issues, we propose the merging network and the admission controller. Then we evaluate the architecture in terms of the hardware resource usage, the maximum clock frequency, and the operation performance. © 2011 IEEE.
研究論文(国際会議プロシーディングス), 英語 - Parallel matrix-matrix multiplication based on HPL with a GPU-accelerated PC cluster
Qin Wang; Junichi Ohmura; Shan Axida; Takefumi Miyoshi; Hidetsugu Irie; Tsutomu Yoshinaga
Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 掲載ページ 243-248, 出版日 2010年, 査読付, In this paper, we propose an approach for significantly improving the performance of parallel matrix-matrix multiplication using a GPU-accelerated cluster. For one node, we implement a CPUs-GPU parallel double-precision general matrix-matrix multiplication (dgemm) operation and achieve a performance improvement of 32% as compared to the GPU-only case and 56% as compared to the CPUs-only case. For the entire cluster, we use the overlap GPU acceleration solution to high-performance Linpack (HPL), which eliminates the close dependency between the LU decomposition and the dgemm operation, and achieve a performance improvement of 17% as compared to the flat GPU acceleration case. © 2010 IEEE.
研究論文(国際会議プロシーディングス), 英語 - CODIE: Continuation-based overlapping data-transfers with instruction execution
Takefumi Miyoshi; Kenji Kise; Hidetsugu Irie; Tsutomu Yoshinaga
Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 掲載ページ 71-77, 出版日 2010年, In this paper, a runtime system termed CODIE is proposed to execute sequential part of programs efficiently in a many-core architecture. All independent processing elements in a many-core architecture use a shared network and off-chip memory. Therefore, contentions on such resources substantially degrade the system performance. On the CODIE system, when a cache miss occurs, the system first initiates a data transfer operation. Next, the system creates a continuation of executing instructions related to the missing data. The continuation is stored into the buffer, and the instructions not related to the missing data are executed subsequently. In other words, data transfer and instruction executions can be performed simultaneously. In this way, the effect of the overhead of the updating cache entry (increased by memory access contention) is tolerated. The results of evaluation show that the proposed CODIE system realizes a 1.86x speed up of the execution of the sequential write/read program on the M-Core architecture at 36 cores and a 1.97x speed up of the execution of the blackscholes(from PARSEC benchmark suite) on the Cell/BE processor with 6 SPEs. © 2010 IEEE.
研究論文(国際会議プロシーディングス), 英語 - OREX: An Optical Ring with Electrical Crossbar Hybrid Photonic Network-on-Chip
Cisse Ahmadou Dit Adi; Ping Qiu; Hidetsugu Irie; Takefumi Miyoshi; Tsutomu Yoshinaga
2010 PROCEEDINGS OF THE INTERNATIONAL WORKSHOP ON INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS (IWIA 2010), IEEE, 掲載ページ 3-10, 出版日 2010年, 査読付, The role of network-on-chip (NoC) is becoming more important as the number of processing elements (PE) integration onto a single chip increases. Lowering power consumption while providing capability of high-performance communication is a challenging problem for the design of future NoCs. In this paper we propose OREX, which is a hybrid NoC consisting of an optical ring and an electrical crossbar central router. OREX takes advantage of both electrical and optical technology designs state-of-art to deliver a high data rate transfer NoC at an acceptable power consumption cost. Using a cycle accurate simulator, we evaluate the proposed hybrid NoC. Simulation experiment shows that OREX presents slightly better communication performance in terms of bandwidth and power consumption compare to a conventional hybrid photonic torus network.
研究論文(国際会議プロシーディングス), 英語 - An efficient path setup for a hybrid photonic Network-on-Chip
Cisse Ahmadou Dit Adi; Hiroki Matsutani; Michihiro Koibuchi; Hidetsugu Irie; Takefumi Miyoshi; Tsutomu Yoshinaga
Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 掲載ページ 156-161, 出版日 2010年, Electrical Network-on-Chip (NoC) faces critical challenges in meeting the high performance and low power consumption requirements for future multicore processors interconnection. Recent tremendous advances in CMOS compatible optical components give the potential for photonics to deliver an efficient NoC performance at an acceptable energy cost. However, the lack of in flight processing and buffering of optical data made the realization of a fully optical NoC complicated. A hybrid architecture which uses optical high bandwidth transfer and a tiny electrical control network can take advantage of both interconnection methods to offer an efficient performance-per-watt infrastructure to connect multicore processors and System-on-Chip (SoC). In this paper, we propose a hybrid photonic torus NoC (HPNoC) that uses a predictive switching to improve the performance of a hybrid architecture. By using prediction techniques, we can reduce the path set up latency for the electrical control network hence improving the overall end-to-end delay for communication in the HPNoC. Simulation results using a cycle accurate simulator under uniform, neighbor and bitreversal traffic patterns for 64 nodes show that predictive switching considerably improves the HPNoC overall performance. © 2010 IEEE.
研究論文(国際会議プロシーディングス), 英語 - 低遅延オンチップネットワークのための予測ルータの評価
松谷宏紀; 鯉渕道絋; 天野英晴; 吉永努
情報処理学会論文誌コンピューティングシステム, 2巻, 3号, 掲載ページ 26-38, 出版日 2009年09月, 査読付
研究論文(学術雑誌), 日本語 - Prediction Router: Yet Another Low Latency On-Chip Router Architecture
Hiroki Matsutani; Michihiro Koibuchi; Hideharu Amano; Tsutomu Yoshinaga
HPCA-15 2009: FIFTEENTH INTERNATIONAL SYMPOSIUM ON HIGH-PERFORMANCE COMPUTER ARCHITECTURE, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 367-+, 出版日 2009年, 査読付, Network-on-Chips (NoCs) are quite latency sensitive, since their communication latency strongly affects the application performance on recent many-core architectures. To reduce the communication latency, we propose a low-latency router architecture that predicts an output channel being used by the next packet transfer and speculatively completes the switch arbitration. In the prediction routers, incoming packets are transferred without waiting the routing computation and switch arbitration if the prediction hits. Thus, the primary concern for reducing the communication latency is the hit rates of prediction algorithms, which vary from the network environments, such as the network topology, routing algorithm, and traffic pattern. Although typical low-latency routers that speculatively skip one or more pipeline stages use a bypass datapath for specific packet transfers (e.g., packets moving on the same dimension), our prediction router predictively forwards packets based on a prediction algorithm selected from several candidates in response to the network environments. In this paper, we analyze the prediction hit rates of six prediction algorithms on meshes, tori, and fat trees. Then we provide three case studies, each of which assumes different many-core architecture. We have implemented a prediction router for each case study by using a 65nm CMOS process, and evaluated them in terms of the prediction hit rate, zero load latency, hardware amount, and energy consumption. The results show that although the area and energy are increased by 6.4-15.9% and 8.0-9.5% respectively, up to 89.8% of the prediction hit rate is achieved in real applications, which provide favorable trade-offs between the modest hardware/energy overheads and the latency saving.
研究論文(国際会議プロシーディングス), 英語 - 耐故障・適応デッドロック回復ルーティングのためのネットワーク再構成プロトコル
吉永努; 西村康彦
電子情報通信学会論文誌, 一般社団法人電子情報通信学会, 91-D巻, 12号, 掲載ページ 2881-2891, 出版日 2008年12月, 並列分散処理計算機用の耐故障/適応ルーチングアルゴリズムとして,動的ネットワーク再構成によってルーチング機能を実行時に切り換える方式が提案されている.本論文では,ネットワーク再構成中に一つのPE (Processing Element)に排出可能なパケット数を設定し,排出パケット数がその値に達するまでネットワークへのパケット注入を継続する動的ネットワーク再構成プロトコルを提案する.これにより,ネットワーク再構成中のパケット注入待ち時間を減らす.対象とするルーチングアルゴリズムは,k-ary n-cube用の耐故障/適応デッドロック回復ルーチングとする.デッドロック回復にup^*/down^*ルーチングとL-turnルーチングを使用する16-ary 2-cubeネットワークについてシミュレーションを行った.提案するプロトコルは,従来の静的,及びパケット注入停止型プロトコルと比較して,ネットワーク再構成中のスループット維持とネットワーク再構成後の低遅延化に貢献することを示す.
研究論文(学術雑誌), 日本語 - ルールベースアクセス制御機能を持つDLNA情報家電の遠隔共有支援機構
武藤大悟; 吉永努
情報処理学会論文誌, 情報処理学会, 49巻, 12号, 掲載ページ 3985-3996, 出版日 2008年12月, 査読付, 我々は,DLNA機器の接続範囲をホームネットワーク内から宅外·家庭間に拡張することを支援するワームホールデバイスと呼ぶソフトウェアを開発した.ワームホールデバイスは,既存のDLNA機器および家庭用UPnPルータとの接続性を持つとともに,SIPサーバを利用してホームネットワーク間の接続を一括して行う.また,ユーザの設定したルールに基づいてDLNA機器やコンテンツのアクセス制御を実現する.市販のDLNA機器や家庭用UPnPルータ,家庭向けインターネット接続サービスを用いた複数のホームネットワーク環境を構築し,相互接続とコンテンツ共有に関する実験を行った.その結果,実用的な遅延時間で遠隔接続とアクセス制御を実現できることが分かった.We developed a software named wormhole device (WD) which supports remote connection of DLNA equipment between two home networks. WD has interoperability with existing DLNA products and household UPnP broadband routers. It utilizes a SIP server to establish remote connection with assisting NAT-Traversal for popular home network environments. It also supports access control functions to share remote DLNA equipments and their contents based on rules which are specified by users. We constructed experiments simulating home networks that are connected to the internet through commercial network providers and using different DLNA-enable device for each home. The experiments examined both remote connection and contents sharing. We show the results that WD realizes safe and easy remote contents sharing as well as access control with acceptable latency.
研究論文(学術雑誌), 日本語 - 予測機構を持つルータを用いた低遅延チップ内ネットワークに関する研究
鯉渕道絋; 吉永努; 村上弘和; 松谷宏紀; 天野英晴
情報処理学会論文誌ACS23, 1巻, 2号, 掲載ページ 59-69, 出版日 2008年08月, 査読付
研究論文(学術雑誌), 日本語 - 2-Dトーラスネットワークにおける動的通信予測による低遅延化
吉永 努; 村上 弘和; 鯉渕 道絋
情報処理学会論文誌, 1巻, 1 (ACS22)号, 掲載ページ 28-39, 出版日 2008年05月, 査読付
研究論文(学術雑誌), 日本語 - The QC-2 parallel Queue processor architecture
Ben A. Abderazek; Arquimedes Canedo; Tsutomu Yoshinaga; Masahiro Sowa
JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, ACADEMIC PRESS INC ELSEVIER SCIENCE, 68巻, 2号, 掲載ページ 235-245, 出版日 2008年02月, 査読付, Queue based instruction set architecture processor offers an attractive option in the design of embedded systems. In our previous work, we proposed a novel queue processor architecture as a starting point for hardware/software design space exploration for embedded applications. In this paper, we present a high performance 32-bit Synthesizable QueueCore (QC-2)-an improved and optimized version of the produced order parallel Queue processor (PQP), with single precision floating-point support. The QC-2 core also implements a novel technique used to extend immediate values and memory instruction offsets that were otherwise not representable because of bit-width constraints in the PQP processor.
A prototype implementation is produced by synthesizing the high-level model for a target FPGA device. We present the architecture description and design results in a fair amount of details. (c) 2007 Elsevier Inc. All rights reserved.
研究論文(学術雑誌), 英語 - Impact of predictive switching in 2-D torus networks
Tsutomu Yoshinaga; Hirokazu Murakami; Michihiro Koibuchi
INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 掲載ページ 11-+, 出版日 2007年, 査読付, Predictive switching is a technique for reducing message latency in parallel computer networks. It tries to decide traversal paths of messages by utilizing a prediction mechanism so that processing time for message headers can be shortened. A key issue of predictive switching is the overhead of prediction failures. This paper presents simple and efficient treatments of prediction failures. Our proposal includes three schemes. The first scheme is arranging predictive and non-predictive routers in a network to safely detect and discard mis-predicted packets. The second is additional hardware to reduce occurrences of mis-predicted packets. The third scheme is to shorten the mis-predicted packets. We show the impact of predictive switching embodying the three schemes for k-ary 2-cubes (k = 8, 16, 32) with dimension-order routing. Our simulation results demonstrate that we can reduce average message latency by minimizing the prediction failure overhead. Network saturation throughput is also improved when the predictor's accuracy is high.
研究論文(国際会議プロシーディングス), 英語 - Mathematical model for multiobjective synthesis of NoC architectures
Ben A. Abderazek; Mushfiquzzaman Akanda; Tsutomu Yoshinaga; Masahiro Sowa
Proceedings of the International Conference on Parallel Processing Workshops, CD巻, 出版日 2007年, 査読付, Network-on-Chip (NoC) interconnections have been proposed to overcome the problems associated with long wires used in chip wide communications. They support asynchronous transfer of communication between cores within multicore systems-on-chips (MCSoCs). The design of such architectures is crucial for achieving high performance and energy efficient systems. However, the effectiveness of NoC based design depends on the adopted design methodology. Automatic design approach is highly desirable to increase system design productivity. This paper presents a new mathematical formulation for synthesizing application specific NoC architectures, such that the performance constraints are satisfied and the communication power consumption is minimized. © 2007 IEEE.
研究論文(国際会議プロシーディングス), 英語 - High-level modeling and FPGA prototyping of produced order parallel queue processor core
Ben A. Abderazek; Tsutomu Yoshinaga; Masahiro Sowa
JOURNAL OF SUPERCOMPUTING, SPRINGER, 38巻, 1号, 掲載ページ 3-15, 出版日 2006年10月, 査読付, Emerging high-level hardware description and synthesis technologies in conjunction with field programmable gate arrays (FPGAs) have significantly lowered the threshold for hardware development. Opportunities exist to integrate these technologies into a tool for exploring and evaluating microarchitectural designs especially for newly proposed architectures. This paper presents a prototyping of a new processor core based on Queue architecture as starting point for application-specific processor design exploration. Using a hardware description language, we have created the Synthesizable model of a produced order parallel queue processor core for the integer subset parallel Queue architecture. A prototype implementation is produced by synthesizing the high-level model for the Stratix FPGA prototyping board. We show how to perform prototyping and optimizations to fully exploit the capabilities of the prototyped Queue processor core, while maintaining a common source base.
研究論文(学術雑誌), 英語 - Improving Linpack Performance on SMP Clusters with Asynchronous MPI Programming
Ta Quoc Viet; Tsutomu Yoshinaga
IPSJ Trans. ACS, 一般社団法人情報処理学会, 47巻, SIG 12 (ACS 15)号, 掲載ページ 340-348, 出版日 2006年09月, 査読付, This study proposes asynchronous MPI a simple and effective parallel programming model for SMP clusters to reimplement the High PerformanceLinpack benchmark. The proposed model forces processors of an SMP node to work in different phases thereby avoiding unneccessary communication and computation bottlenecks. As a result we can achieve significant improvements in performance with a minimal programming effort. In comparison with a de-facto flat MPI solution our algorithm can yield a 20.6% performance improvement for a 16-node cluster of Xeon dual-processor SMPs.This study proposes asynchronous MPI, a simple and effective parallel programming model for SMP clusters, to reimplement the High PerformanceLinpack benchmark. The proposed model forces processors of an SMP node to work in different phases, thereby avoiding unneccessary communication and computation bottlenecks. As a result, we can achieve significant improvements in performance with a minimal programming effort. In comparison with a de-facto flat MPI solution, our algorithm can yield a 20.6% performance improvement for a 16-node cluster of Xeon dual-processor SMPs.
研究論文(学術雑誌), 英語 - Predictive switching in 2-D torus routers
Tsutomu Yoshinaga; Shojiro Kamakura; Michihiro Koibuchi
INTERNATIONAL WORKSHOP ON INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 掲載ページ 65-72, 出版日 2006年, This paper proposes predictive switching in 2-D torus routers to reduce the number of pipeline stages for low-latency communication. By utilizing the communication regularity in parallel applications, a dynamic predicting mechanism presets packet traversal paths inside the router before packet arrivals. Hence, we can bypass the pipeline stages of routing computation, virtual channel allocation and switch allocation when the prediction hits. We considered the predictor architecture and accuracy for several traffic patterns in NAS parallel benchmarks. Our experiments show that a sampled pattern matching (SPM) predictor achieves 77% to 96% of the prediction hit rates when we use the dimension-order routing algorithm. We also discuss a method to improve the prediction accuracy of SPM by examining the frequency of occurrence for the prediction values in the communication history.
研究論文(国際会議プロシーディングス), 英語 - A partial irregular-network routing on faulty k-ary n-cubes
Michihiro Koibuchi; Tsutomu Yoshinaga; Yasuhiko Nishimura
INTERNATIONAL WORKSHOP ON INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 掲載ページ 57-64, 出版日 2006年, Interconnection networks have been studied to connect a number of processing elements on parallel computers. Their design increasingly includes a challenge to high fault-tolerance, as entire systems become complicated. This paper presents a partial irregular-network routing in order to provide a high fault-tolerance in k-ary n-cube networks. Since an irregular-network routing usually performs poorly in k-ary n-cube networks, it is only used for progressive deadlock-recovery, and avoiding hard failures. The network is logically divided into the fault and regular regions. In the regular region, most packets are transferred along fully adaptive paths that are computed, assuming that there are no hard failures, so as to uniformly distribute the traffic. Simulation results show that the proposed routing achieves the same throughput as that of Duato's protocol under no hard failures. As the number of faulty links increases to up to 8 on 256 nodes, its throughput is only decreased by 15%. Moreover the throughput of the proposed deadlock recovery routing is almost maintained during a dynamic reconfiguration.
研究論文(国際会議プロシーディングス), 英語 - Scalable core-based methodology and synthesizable core for systematic design environment in multicore SoC (MCSoC)
Ben A. Abderazek; Tsutomu Yoshinaga; Masahiro Sowa
2006 INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING WORKSHOPS, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 345-+, 出版日 2006年, 査読付, The strong demand for complex and high performance embedded system-on-chip requires quick turn around design methodology and high performance cores. Thus, there is a clear need for new methodologies supporting efficient and fast design of these systems on complex platforms implementing both hardware and software modules.
In this paper, we describe a novel scalable core-based methodology for systematic design environment of application specific heterogeneous multicore systems-on-chip (MC-SoC). We also developed a high performance 32-bit Synthesizable QueueCore (QC-2) with single precision floating point support. The core is targeted for special purpose applications within our target MCSoC system. We present the architecture description and design results in a fair amount of details.
研究論文(国際会議プロシーディングス), 英語 - Asynchronous Parallel Programming Model for SMP Clusters
Ta Quoc Viet; Tsutomu Yoshinaga
Proc. of the IASTED Int. Conf. on Parallel and Distributed Computing Systems (PDCS 2005), 掲載ページ 466-070, 6 pages in CD, 出版日 2005年11月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Parallel queue processor architecture based on produced order computation model
M Sowa; BA Abderazek; T Yoshinaga
JOURNAL OF SUPERCOMPUTING, SPRINGER, 32巻, 3号, 掲載ページ 217-229, 出版日 2005年06月, 査読付, This paper proposes novel produced order parallel queue processor architecture. To store intermediate results, the proposed system uses a first-in-first-out (FIFO) circular queue-registers instead of random access registers. Datum is inserted in the queue-registers in produced order scheme and can be reused. We show that this feature has profound implications in the areas of parallel execution, programs compactness, hardware simplicity and high execution speed.
Our performance evaluations show a significant performance improvement (e.g., 10 to 26% decrease in program size and 6 to 46% decrease in execution time over a range of benchmark programs) when compared with the earlier proposed architecture.
研究論文(学術雑誌), 英語 - Construction of Hybrid MPI-OpenMP Solutions for SMP Clusters
Ta Quoc Viet; Tsutomu Yoshinaga; Ben A. Abderazek; Masahiro Sowa
Transactions on Advanced Computing Systems, 一般社団法人情報処理学会, 46巻, ACS8号, 掲載ページ 25-37, 出版日 2005年01月, 査読付, This paper proposes a middle-grain approach to construct hybrid MPI-OpenMP solutions for SMP clusters from an existing MPI algorithm. Experiments on different cluster platforms show that our solutions exceed the solutions that are based on the de-facto MPI model in most cases and occasionally by as much as 40% of performance. We also prove an automatic outperformance of a thread-to-thread communication model over a traditional process-toprocess communication model in hybrid solutions. In addition the paper performs a detailed analysis on the hardware and software factors affecting the performance of MPI in comparison to hybrid models.This paper proposes a middle-grain approach to construct hybrid MPI-OpenMP solutions for SMP clusters from an existing MPI algorithm. Experiments on different cluster platforms show that our solutions exceed the solutions that are based on the de-facto MPI model in most cases, and occasionally by as much as 40% of performance. We also prove an automatic outperformance of a thread-to-thread communication model over a traditional process-toprocess communication model in hybrid solutions. In addition, the paper performs a detailed analysis on the hardware and software factors affecting the performance of MPI in comparison to hybrid models.
英語 - Modular design structure and high-level prototyping for novel embedded processor core
BA Abderazek; S Kawata; T Yoshinaga; M Sowa
EMBEDDED AND UBIQUITOUS COMPUTING - EUC 2005, SPRINGER-VERLAG BERLIN, 3824巻, 掲載ページ 340-349, 出版日 2005年, 査読付, In this research work, we present a high-level prototyping of a new processor core based on Queue architecture as starting point for application-specific processor design exploration. Using modular design structure with control logic implemented as a set of communicating state machines, we show hardware emulation and optimizations results of a parallel queue proecssor architecture (QueueCore). We also show how to to fully exploit the capabilities of the designed QueueCore, while maintaining a common source base. From the evaluation results, we show that the QueueCore prototype fits on a single conventional FPGA device, thereby obviating the need to perform multi-chip partitioning which results in a loss of resource efficiency.
研究論文(学術雑誌), 英語 - Performance evaluation of dynamic network reconfiguration using Detour-UD routing
T Yoshinaga; Y Nishimura
INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 掲載ページ 110-118, 出版日 2005年, Fault-tolerance is an emerging issue for massively parallel computers. This paper describes the performance impact of dynamic network reconfiguration protocols using a fault-tolerant, adaptive deadlock-recovery routing algorithm, Detour-UD, for k-ary n-cubes. We propose a scheme to specify unroutable packets by managing drain-flags in routing tables. We also propose two selective drainage protocols. One protocol drains the unroutable packets specified by the drain-flags after the reconfiguration process. The other protocol drains deadlocked packets to reduce the network load during the reconfiguration process. Our simulation results show that the first protocol helps reduce the number of drainage packets, and the second one keeps the network throughput during the reconfiguration process.
研究論文(国際会議プロシーディングス), 英語 - 耐故障性を考慮した k-ary n-cube 用デッドロック回復ルーティング
吉永努; 細越洋行; 曽和将容
情報処理学会ACS論文誌, 情報処理学会, 45巻, SIG 11(ACS7)号, 掲載ページ 408-419, 出版日 2004年10月, 査読付
研究論文(学術雑誌), 日本語 - High Performance Hybrid Processor Architecture with Efficient Hardware Usability
Akanda Md; Musfiquzzaman; Ben A. Abderazek; Soichi Shigeta; Tsutomu; Yoshinaga; Masahiro Sowa
Proceedings on International Workshop on Modern Science and Technology, 掲載ページ 43-46, 出版日 2004年09月
研究論文(国際会議プロシーディングス), 英語 - Design of Producer-Order Parallel Queue Processor Architecture
A. Markovskij; B.A. Abderazek; S. Shigeta; T. Yoshinaga; M. Sowa
Proceedings on International Workshop on Modern Science and Technology, 掲載ページ 25-28, 出版日 2004年09月
研究論文(国際会議プロシーディングス), 英語 - QJava: Integrate Queue Computational Model into Java
S. Shigeta; L.-Q. Wang; N. Yagishita; B. A. Abderazek; T. Yoshinaga; M. Sowa
Proc. of the Joint Japan-Tunisia Workshop on Computer Systems and Information Technology (JT-CSIT'04), 掲載ページ 60-65, 出版日 2004年07月
研究論文(国際会議プロシーディングス), 英語 - Optimization for Hybrid MPI-OpenMP Programs on a Cluster of SMP PCs
Tsutomu Yoshinaga; Ta Quoc Viet
Proc. of the Joint Japan-Tunisia Workshop on Computer Systems and Information Technology (JT-CSIT'04), 掲載ページ 28-35, 出版日 2004年07月
研究論文(国際会議プロシーディングス), 英語 - Theoretical Evaluation of Simultaneous Multithreading Parallel Queue Processor Architecture
Hirotoshi Sasaki; Yoshitomo Okumura; Ben Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
International Conference on Circuits/Systems, Computers and Communications, 掲載ページ 6D1L-2-1~4, 出版日 2004年07月
研究論文(国際会議プロシーディングス), 英語 - Fault-tolerant adaptive deadlock-recovery routing for k-ary n-cube networks
T Yoshinaga; H Hosogoshi; M Sowa
INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 49-58, 出版日 2004年, 査読付, This paper proposes a fault-tolerant fully adaptive deadlock-recovery routing algorithm for k-ary n-cube networks. We intend to consider both the adaptability for faults and the communication performance by integrating regular and irregular network routing. Our algorithm tolerates any number or shape of faults without disabling fault-free nodes by maintaining routing tables that are configured based on faulty information. Our algorithm also provides minimal misrouting paths around faults by guaranteeing deadlock freedom using only two virtual channels per physical channel. Simulation results show that the proposed algorithm attains robust communication performance for uniform and nonuniform traffic patterns not only on a fault-free torus network but also on irregular tori with faulty nodes.
研究論文(国際会議プロシーディングス), 英語 - Queue processor architecture for novel queue computing paradigm based on produced order scheme
BA Abderazek; M Arsenji; S Shigeta; T Yoshinaga; M Sowa
SEVENTH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND GRID IN ASIA PACIFIC REGION, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 169-177, 出版日 2004年, 査読付, This paper proposes novel produced order parallel queue processor architecture. To store intermediate results, the proposed system uses a FIFO queue registers instead of random access registers. Datum is inserted in the queue in produced order scheme and can be reused. We will show that this feature has a profound implication in the areas of parallel execution, programs compactness, hardware simplicity and high execution speed. Our preliminary performance evaluations have shown a significant performance improvement (e.g., 10% to 26% decrease in program size and 6% to 46% decrease in execution time over a range of benchmark programs) when compared with the earlier proposed architecture.
研究論文(国際会議プロシーディングス), 英語 - QJAVAC: Queue-Java Compiler Design for High Parallelism Queue Java Bytecode
Li. Qiang Wang; Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
International Conference on Circuits/Systems, Computers and Communications (ITC-CSCC2003), 掲載ページ 900-903, 出版日 2003年07月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Architectural Issues in the Design of a High Performance Parallel Queue Processor
Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
4th Bilateral Symposium on Science & Technology, 出版日 2003年04月
研究論文(国際会議プロシーディングス), 英語 - Design and evaluation of a fault-tolerant adaptive router for parallel computers
T Yoshinaga; H Hosogoshi; M Sowa
INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 掲載ページ 100-107, 出版日 2003年, In this paper, we propose a design methodology for fault tolerant adaptive routers for parallel and distributed computers. The key idea of our method is integrating minimal and non-minimal routing that is supported by independent virtual channels (VCs). Distinguishing the routing functions for each set of VCs simplifies the design of fault-tolerant algorithms. After describing the method, we show an application of a routing algorithm for two-dimensional mesh and torus networks. This algorithm, called Detour-NF, supports three routing modes: deterministic, minimal fully adaptive and non-minimal fault-tolerant operations. We also discuss the hardware cost and operational speed of minimal and non-minimal routers based on our design, which uses hardware description language (HDL).
Communication performance and fault-tolerance are demonstrated by an HDL simulation. The experimental results show that supporting both minimal and non-minimal routing modes is advantageous for high-bandwidth and low-latency communication, as well as fault-tolerance.
研究論文(国際会議プロシーディングス), 英語 - On the design of a register queue based processor architecture (FaRM-rq)
BA Abderazek; S Shigeta; T Yoshinaga; M Sowa
PARALLEL AND DISTRIBUTED PROCESSING AND APPLICATIONS, PROCEEDINGS, SPRINGER-VERLAG BERLIN, 2745巻, 掲載ページ 248-262, 出版日 2003年, 査読付, We propose in this paper a processor architecture that supports multi instructions set through run time functional assignment algorithm (RUNFA). The above processor, which is named Functional Assignment Register Microprocessor (FaRM-rq) supports queue and register based instruction set architecture and functions into different modes: (1) R-mode (FRM) - when switched for register based instructions support, and (2) Q-mode (FQM) - when switched for Queue based instructions support. The entities share a common data path and may operate independently though not in parallel.
In FRM mode, the machine's shared storage unit (SSU) behaves as a conventional register file. However, in FQM mode, the system organizes the SSU access as a first-in-first-out latches, thus accesses concentrate around a small window and the addressing of registers is implicit trough the Queue head and tail pointers.
First, we present the novel aspects of the FaRM-rq(1) architecture. Then, we give the novel FQM fundamentals and the principles underlying the architecture.
研究論文(学術雑誌), 英語 - Proposal and Design of a Parallel Queue Processor Architecture (PQP)
M. Sowa; B. A. Abderazek; S. Shigeta; K. Nikolova; T. Yoshinaga
Proc. 14th IASTED International Conference on Parallel and Distributed Computing and Systems, 掲載ページ 554-560, 出版日 2002年10月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Complexity Analysis of a Functional Assignment Register Microprocessor
Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
International Workshop on Modern Science and Technology (IWMST2002), 掲載ページ 116-123, 出版日 2002年09月
研究論文(国際会議プロシーディングス), 英語 - High parallelism Java Compiler with Queue Architecture
Li-Qiang Wang; Tsutomu Yoshinaga; Masahiro Sowa
International Workshop on Modern Science and Technology (IWMST02), 掲載ページ 130-135, 出版日 2002年09月
研究論文(国際会議プロシーディングス), 英語 - A scalable FPGA-based custom computing machine for a medical image processing
T Yokota; M Nagafuchi; Y Mekada; T Yoshinaga; K Ootsu; T Baba
10TH ANNUAL IEEE SYMPOSIUM ON FIELD-PROGRAMMABLE CUSTOM COMPUTING MACHINES, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 307-308, 出版日 2002年, Concentration index filter is a kind of spatial filters of images, and its typical application is diagnosis from medical images. This paper presents a dedicated computing engine for concentration index filtering. Original algorithm is modified to extract full parallelism and data width is optimized for maximizing clock speed and minimizing hardware scale. Evaluation results reveal that the system runs 100 times faster than current workstation and enables real-time diagnosis.
研究論文(国際会議プロシーディングス), 英語 - Real-time medical diagnosis on a multiple FPGA-based system
T Yokota; M Nagafuchi; Y Mekada; T Yoshinaga; K Ootsu; T Baba
FIELD-PROGRAMMABLE LOGIC AND APPLICATIONS, PROCEEDINGS, SPRINGER-VERLAG BERLIN, 2438巻, 掲載ページ 1088-1091, 出版日 2002年, 査読付, The concentration index is a novel characteristic measurement that indicates the degree of concentration of lines to a certain point. Its typical application is medical diagnosis; for example, gastric cancer has a distinctive nature that folds concentrate to the lesion. Its large computational complexity requires much computing time. This paper presents a multiple FPGA-based computing architecture which accelerates the concentration index calculation and enables real-time diagnosis of gastric cancer. Evaluation results reveal that gate- and pin- counts are within those of todays' FPGA devices, and that the diagnosis process should be accelerated about 100 times faster than ordinal workstations..
研究論文(学術雑誌), 英語 - 受信メッセージ予測法によるMPI受信処理の高速化
岩本善行; 足立涼子; 大津金光; 吉永努; 馬場敬信
情報処理学会論文誌, 情報処理学会, 42巻, 4号, 掲載ページ 812-820, 出版日 2001年04月, 査読付
研究論文(学術雑誌), 日本語 - 仮想チャネル数と動作周波数を考慮した適応ルータの性能評価
堀田真貴; 吉永努; 大津金光; 馬場敬信
情報処理学会論文誌, 情報処理学会, 42巻, 4号, 掲載ページ 714-723, 出版日 2001年04月, 査読付
研究論文(学術雑誌), 日本語 - Design and evaluation of speculative multithreading with selective multi-path execution
K. Ootsu; T. Yoshinaga; T. Baba
Proceedings - 15th International Parallel and Distributed Processing Symposium, IPDPS 2001, Institute of Electrical and Electronics Engineers Inc., 掲載ページ 1409-1416, 出版日 2001年, 査読付, Thread Level Parallelism (TLP) is the most promising way to the future high-performance microprocessors. When a sequential program code is speculatively executed in a multithreaded manner, it is natural that each speculative thread follows the control flow of the program. Based on this background, various studies have been performed on speculative multithreading, following control flow graph. This paper proposes a new execution model that aims at the speedup of the execution of usual sequential program codes by speculatively executing the multiple control flows in parallel. Further, this paper shows the thread control mechanism and the inter-thread communication facility required for the realization of the model. For the evaluation of our model, the cycle-based instruction-level simulator has been developed. We evaluate our model with simple benchmark programs and show the effectiveness of our model especially, for the case where the speculation by single control flow is difficult to speedup the programs.
研究論文(国際会議プロシーディングス), 英語 - 受信メッセージ予測方式の検討
岩本善行; 大津金光; 吉永 努; 馬場敬信
情報処理学会論文誌, 情報処理学会, 41巻, 09号, 掲載ページ 2582-2591, 出版日 2000年09月, 査読付
研究論文(学術雑誌), 日本語 - Performance Evaluation of the Recover-X Adaptive Router for 2D Torus Networks
T. Yoshinaga; M. Hayashi; M. Horita; S. Nakamura; K. Ootsu; T. Baba
Proceedings of the World Multiconference on Systemics, Cybernetics and Informatics 2000, 4巻, 掲載ページ 107-112, 出版日 2000年08月, 査読付
研究論文(国際会議プロシーディングス), 英語 - Recover-X適応ルーティング
吉永 努; 林 匡哉; 堀田真貴; 中村さゆり; 大津金光; 馬場敬信
情報処理学会論文誌, 情報処理学会, 41巻, 5号, 掲載ページ 1360-1369, 出版日 2000年05月, 査読付
研究論文(学術雑誌), 日本語 - Design, Implementation and Evaluation of a Parallel Object-Oriented Language A-NETL
Takanobu Baba; Tsutomu Yoshinaga; Yoshiyuki Iwamoto; Kanemitsu Ootsu
Parallel and Distributed Computing Practices, 3巻, 2号, 掲載ページ 199-219, 出版日 2000年, 査読付
研究論文(学術雑誌), 英語 - Efficient Implementation of a Parallel Object-Oriented Language A-NETL on Multicomputers
Takanobu Baba; Tsutomu Yoshinaga; Yoshiyuki Iwamoto; Somchai Numprasertchai; Norihito Saitoh; Kanemitsu Ootsu; Mitsutoshi Hori
Proc. France-Japan Workshop on Object-Based Parallel and Distributed Computation, Object-Oriented Parallel and Distributed Programming, 掲載ページ 75-93, 出版日 2000年
研究論文(国際会議プロシーディングス), 英語 - Recover-x: An adaptive router with limited escape channels
T Yoshinaga; M Hayashi; M Horita; S Nakamura; K Ootsu; T Baba
SEVENTH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 272-279, 出版日 2000年, 査読付, In order to improve network performance, a variety of adaptive routing algorithms has been proposed. Recent research focuses oil their implementation costs, as well as the performance to enhance their practical applications. This paper proposes the Recover-x adaptive routing, which limits escape message candidates in a blocked or deadlocked configuration. This limitation simplifies the routing logic and offers a chance to balance the usage between adaptive and non-adaptive channels.
The cost and performance of four wormhole routers based on Verilog-HDL designs were compared. Synthesis results for the chosen gate at-ray technology show that the Recover-x router attains a fast operating speed and low-latency, with high-bandwidth communication performance.
研究論文(国際会議プロシーディングス), 英語 - 並列オブジェクト指向言語A-NETLの実現とその評価
馬場敬信; 吉永努; 岩本善行; 斎藤宣人; S. Numprasertchai
情報処理学会論文誌, 情報処理学会, 40巻, 9号, 掲載ページ 3554-3563, 出版日 1999年, 査読付
研究論文(学術雑誌), 日本語 - Message Prediction and Speculative Execution of the Reception Process
Y. Iwamoto; K. Ootsu; T. Yoshinaga; T. Baba
Proc. IASTED International Conference on Parallel and Distributed Computing and Systems '99, 掲載ページ 329-334, 出版日 1999年, 査読付
研究論文(国際会議プロシーディングス), 英語 - A-NET マルチコンピュータにおける仮想時間を用いた性能評価法とその実現
岩本善行; 阿部大輝; 大津金光; 吉永努; 馬場敬信
情報処理学会論文誌, 情報処理学会, 40巻, 5号, 掲載ページ 1947-1957, 出版日 1999年, 査読付
研究論文(学術雑誌), 日本語 - A Parallel Navigation Algorithm with Dynamic Load Balancing for OODBMSs
L. Mutenda; T. Baba; T. Yoshinaga; K. Ootsu
Trans. on IPSJ Database Systems, 40巻, SIG5(TOD2)号, 掲載ページ 29-42, 出版日 1999年, 査読付
研究論文(学術雑誌), 英語 - A speculative multithreading with selective multi-path execution
K Ootsu; W Yoshinari; F Furukawa; T Yoshinaga; T Baba
INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 掲載ページ 46-52, 出版日 1999年, 査読付, Recent microprocessors' performance has been improved by their high-speed clock frequency and by their exploiting instruction-level parallelism (ILP). Physical limitations of clock speed and semantical limitations of control dependencies impede the improvement of performance. To overcome this difficulty, it is indispensable to make use of the thread-level parallelism. This paper proposes a speculative thread execution model that aims at a speed-up of sequential program execution by selective multi-path thread execution.
研究論文(国際会議プロシーディングス), 英語 - 適応ルータの出力チャネル選択における優先次元指定の効果
吉永努; 林匡哉; 堀田真貴; 山口喜教; 大津金光; 馬場敬信
情報処理学会 論文誌, 情報処理学会, 40巻, 5号, 掲載ページ 1958-1967, 出版日 1999年, 査読付, 本論文では メッセージごとに適応ルーティング時に優先する出力チャネルやFIFO性保証のための適応ルーティングの禁止を指定可能なルーティングを提案する. また そのハードウェアコストと性能をハードウェア記述言語により設計したルータの論理合成とシミュレーションによって評価する. その結果 優先次元指定ルーティングは (1)バーチャルチャネルの追加と比較して 小さなコストでサポートできる (2)ホットスポットを形成する通信パターンのスループットを大きく改善する (3)適応性が制限可能であることは FIFO性の保証のみでなく ユニフォーム通信におけるネットワークの負荷を均等に保つことに対しても有効活用できる などを明らかにした.We propose a new adaptive routing method which is capable of selecting, based on a prioritizing system, a particular dimension to output each message. We have compared its hardware cost and performance based on HDL designs. The results of HDL synthesis and simulation lead to the following conclusions: (1) The dimension-selective routing can be sup-ported inexpensively compared with adding virtual channels; (2) Adaptive routers which support communication scheduling are effective in improving network performance; (3) The ability to restrict adaptive routing is useful not only in maintaining in-order message delivery but also balancing the overall network load for uniform communication traffic.
研究論文(学術雑誌), 日本語 - The A-NET working prototype: A parallel object-oriented multicomputer with reconfigurable network
T Baba; T Yoshinaga; Y Iwamoto; D Abe
INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 40-49, 出版日 1998年, A multicomputer prototype has been co-designed and implemented in conjunction with a programming language, A-NETL, based on a parallel object-oriented computation model. Each node processor consists of a processing element and a router. The prototype PE has an A-NETL directed, high-level instruction set. The implementation is supported by firmware and hardware. The router has been designed to be independent of network topology, utilizing virtual-cut-through, adaptive routing.
Experimental results show that a round trip for a, 35-byte message between adjacent nodes takes 85 machine cycles (MCs), and 6 MCs per hop; adaptive routing attains low latency communication under contention; the adaptation of network topology to a given communication pattern shows better performance than a generic topology; and the application to small problems attains a 10 to 18 times speedup on the 16-node prototype.
研究論文(国際会議プロシーディングス), 英語 - A-NETマルチコンピュータのシステム性能評価
吉永努; 澤田東; 廣田守; 阿部大輝; 岩本善行; 馬場敬信
電子情報通信学会 論文誌, 電子情報通信学会, J81-D-I巻, 4号, 掲載ページ 368-376, 出版日 1998年, 査読付, A-NETマルチコンピュータは, 並列オブジェクト指向言語A-NETLの設計と共に, トータルアーキテクチャの一環として開発した分散メモリ型並列計算機である.16ノードプロトタイプを使用した実験から, 通信性能は, 35バイトの隣接メッセージ転送に対して往復85マシンサイクル, 1ホップ当りの遅延時間は6マシンサイクルであることがわかった.また, 衝突による通信遅延は, PEの処理速度に対して十分高速であり, 適応型ルーチングの効果を確認した.更に, メッセージのオーバヘッドを変化させたA-NETLプログラムの実行結果から, 通信処理や並列アルゴリズムが実行性能に与える影響について考察した.実験したプログラムでは, 16ノードで約9.6〜18倍の台数効果が得られた.
研究論文(学術雑誌), 日本語 - メッセージ転送処理の高速化法とその評価
岩本善行; 澤田東; 阿部大輝; 澤田康雄; 大津金光; 吉永努; 馬場敬信
情報処理学会論文誌, 情報処理学会, 39巻, 6号, 掲載ページ 1663-1671, 出版日 1998年
研究論文(学術雑誌), 日本語 - A cost and performance comparison for wormhole routers based on HDL designs
T Yoshinaga; M Hayashi; M Horita; Y Yamaguchi; K Ootsu; T Baba
1998 INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 掲載ページ 375-382, 出版日 1998年, 査読付, Our research investigates cost and performance characteristics for wormhole routers based on HDL designs. Comparison for dimension-order routers and turn model-based adaptive routers leads to the following conclusions: (1) Static and additional routing information which we propose in this paper, such as prior dimension specification and in-order delivery, improves the communication performance.(2) An adaptive routing algorithm must be implemented to satisfy the objective speed of the design. The operation speed of the routers affects the network; performance a lot. (3) The virtual channels cancel the improvement not only for the dimension-order router but also for the naive implementation of the adaptive routers when they degrade the operation speed.
研究論文(国際会議プロシーディングス), 英語 - Parallel navigation in an A-NETL based parallel OODBMS
Lawrence Mutenda; Manabu Hiyama; Tsutomu Yoshinaga; Takanobu Baba
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), Springer Verlag, 1336巻, 掲載ページ 305-316, 出版日 1997年, 査読付, A parallel OODBMS has been proposed based on a parallel object-oriented language, A-NETL. The OODBMS is designed for a shared-nothing environment. An overview of the database system is described. Accessing object-data in a parallel OODBMS is based on navigation. A parallel navigation algorithm being implemented for use in the system is presented including its features. The algorithm is based on the need to balance the load across all nodes in a parallel OODB accessing objects with set-valued attributes. An analytical evaluation of the features of the algorithm is prescnted.
研究論文(国際会議プロシーディングス), 英語 - 並列オブジェクト指向言語A-NETLの高並列計算機への実装
吉永努; 馬場敬信; S. Numprasertchai
電子情報通信学会論文誌, 電子情報通信学会, J80-D-I巻, 9号, 掲載ページ 787-790, 出版日 1997年, 実行性能と移植性を考慮した, 並列オブジェクト指向言語の高並列計算機への実装と評価について報告する. コンパイラが, 受信メッセージのハンドラやメソッドディスパッチャのコードを自動生成することにより, 高機能なメッセージインタフェースやアクティブオブジェクトをサポート可能である. コンパイル時の最適化により, ターゲットマシンのC言語プログラムに近い性能でメッセージパッシングできることが分かった. また, サンプルプログラムを用いて, 並列処理による台数効果を確認した.
研究論文(学術雑誌), 日本語 - 並列オブジェクト指向言語A-NETLのイベントベースデバッギング システム
馬場敬信; 古谷泰重; 吉永努
信学論 (D-I), 電子情報通信学会, J79-D-I巻, 6号, 掲載ページ 331-340, 出版日 1996年06月, 査読付
研究論文(学術雑誌), 日本語 - 並列オブジェクト指向トータルアーキテクチャA-NETのノードプロセッサ
吉永努; 馬場敬信
電子情報通信学会 論文誌, 電子情報通信学会, J79-D-I巻, 2号, 掲載ページ 60-68, 出版日 1996年, 査読付, 並列オブジェクト指向計算モデルに基づく高並列計算機のノードプロセッサを計算し, プロトタイプを試作した。このノードプロセッサは, メソッドを実行するPEと, メッセージの送受信を行うルータからなる. PEは, メッセージ送受信命令などの高機能命令セットを命令前処理ユニット(IPU)でデコードし, マイクロプログラムで実行する. また, 同期機構や動的データ型付けなどをサポートするためのタグ付きアーキテクチャを採用し, これをタグ処理ユニット(TPU)によりハードウェア支援する. TPUの効果を加算命令を例に調べた結果, TPUを使用しない場合より実行時間(マイクロステップ数)が約44%高速化できることがわかった. また, IPUを使用しないと3倍程度の実行ステップ数が必要となる. プロトタイプを30MHzで動作させてメッセージの転送時間を実測した結果, 35Byteのメッセージを隣接ノードに転送するのに約5.2μs, 1ホップ当りの遅延時間が約1.0μsであることが確認できた.
研究論文(学術雑誌), 日本語 - A DECLARATIVE SYNCHRONIZATION MECHANISM FOR PARALLEL OBJECT-ORIENTED COMPUTATION
T BABA; N SAITOH; T FURUTA; H TAGUCHI; T YOSHINAGA
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRON INFO COMMUN ENG, E78D巻, 8号, 掲載ページ 969-981, 出版日 1995年08月, We have designed and implemented a simple yet powerful declarative synchronization mechanism for a parallel object-oriented computation model. The mechanism allows the user to control multiple message reception, specify the order of message reception, lock an invocation, and specify relations as invocation constraints. It has been included in a parallel object-oriented language, called A-NETL. The compiler and operating system have been developed on a total architecture, A-NET (Actors NETwork). The experimental results show that (i) the mechanism allows the user to model asynchronous events naturally, without losing the integrity of described programs; (ii) the replacement of the mechanism with the user's code requires tedious descriptions, but gains little performance enhancement, and certainly loses program readability and integrity; (iii) the mechanism allows the user to shift synchronous programs to asynchronous ones, with a scalable reduction of execution times: an average 20.6% for 6 to 17 objects and 46.1% for 65 objects. These prove the effectiveness of the proposed synchronization mechanism.
研究論文(学術雑誌), 英語 - Programming and Debugging for Massive Parallelism: The Case for a Parallel Object-Oriented Language A-NETL
Takanobu Baba; Tsutomu Yoshinaga; Takahiro Furuta
Proc. Workshop on Object-Based Parallel and Distributed Computation, Springer, Lecture Notes in Computer Science 1107, Springer-Verlag, 掲載ページ 38-58, 出版日 1995年
研究論文(国際会議プロシーディングス), 英語 - A-NETL: A Language for Massively Parallel Object-Oriented Computing
Takanobu Baba; Tsutomu Yoshinaga
Proc. Massively Parallel Programming Models, 掲載ページ 98-105, 出版日 1995年, 査読付
研究論文(国際会議プロシーディングス), 英語 - トポロジカルなプログラミングが可能な並列オブジェクト指向言語A-NETL
吉永努; 馬場敬信
電子情報通信学会 論文誌, 電子情報通信学会, J77-D-I巻, 8号, 掲載ページ 557-566, 出版日 1994年, 査読付, A-NETLは,並列オブジェクト指向トータルアーキテクチャA-NETプロジェクトにおいて設計された高並列プログラミング言語であり,(1)静的な多数オブジェクトの定義を可能とするインデックストオブジェクト,(2)ノード指定可能な動的オブジェクト生成,(3)メッセージのマルチキャストとマルチレシーブ,(4)メソッドの実行順序制御などに特徴がある.インデックストオブジェクトは,体系的にオブジェクトグループを扱うのに有効である.グループに属する一連のオブジェクトの起動と処理の待合せについては,メッセージの並列送受信構文を用いて簡便に記述できる.また,動的に構造が変化する問題に対しては,割付けノードを指定した動的オブジェクト生成を使用できる.ユーザは,これらの機能を利用することにより,問題固有の並列性をネットワークトポロジーに反映したプログラミングが可能となる.更に,個々のオブジェクト間の通信関係を反映したオブジェクト間関係宣言を用いることにより,非定型的な問題も容易に扱うことができる.オブジェクトの内部状態の保護とメッセージのディスパッチについては,メソッドの実行順序制御と起動条件に関する制御構文を与えることにより,オブジェクトの自律的な動作を可能とする.
研究論文(学術雑誌), 日本語 - 並列オブジェクト指向トータルアーキテクチャA-NETのためのトポロジ独立なルータの構成
吉永努; 馬場敬信
情報処理学会論文誌, 一般社団法人情報処理学会, 34巻, 4号, 掲載ページ 648-657, 出版日 1993年04月, 査読付, 並列オブジェクト指向実行モデルに基づくA?NET高並列計算機のルータを設計した。A-NETルータは、静的に可変な種々のネットワークトポロジをサポートするため、プログラマブル通信制御装置を用いてメッセージの経路選択を行う。メッセージは、適応型バーチャルカットスルー方式による可変長パケット交換により実現する。また、ユーザ定義のオブジェクトやメソッドを動的にノード間転送するために、サーキットスイッチ方式のデータ転送もサポートする。ルータは、ホスト用に1ポート、および隣接ルータとの接続用に6ポートを梼ち、PEインタフェース回路、メッセージセンダ/レシーバ、パケット退避用バッファなどをクロスバ網で接続した構成をとる。これらクロスバ網に接続した各ブロックは、パケットやオブジェクトコードなどの転送主体となり、パケットの経路選択、およびクロスバ網の設定はプログラマブル通信制御装置が行う。各ブロックは、それぞれステートマシンを内蔵して独立に動作し、ルータ内で並列にデータ転送が行える。通信性能を評価した結果、無衝突時のパケットの1ホップ当りの経路選択時間は、約2usで、平均的なサイズのパケットの転送時間は10?48us程度(距離1?20)であることが分かった。この値は、PE上での1メッセージ当りのユーザプログラムの連続実行時間とバランスの取れたものといえる。
研究論文(学術雑誌), 日本語 - 並列オブジェクト指向トータルアーキテクチャA-NETにおける 言語とアーキテクチャの統合
馬場敬信; 吉永努
信学論, 電子情報通信学会, J75-D-I巻, 8号, 掲載ページ 563-574, 出版日 1992年08月
研究論文(学術雑誌), 日本語 - A Local Operating System for the A-NET Parallel Object-Oriented Computer
Tsutomu Yoshinaga; Takanobu Baba
Journal of Information Processing, 14巻, 4号, 掲載ページ 414-422, 出版日 1992年04月, 査読付
研究論文(学術雑誌), 英語 - A PARALLEL OBJECT-ORIENTED LANGUAGE A-NETL AND ITS PROGRAMMING ENVIRONMENT
T YOSHINAGA; T BABA
COMPSAC 91 - THE FIFTEENTH ANNUAL INTERNATIONAL COMPUTER SOFTWARE & APPLICATIONS CONFERENCE, PROCEEDINGS, I E E E, COMPUTER SOC PRESS, 掲載ページ 459-464, 出版日 1991年, 査読付
研究論文(国際会議プロシーディングス), 英語 - MUNAP上の拡張L6言語を用いた3次元色彩図形処理
馬場敬信; 加賀谷学; 吉永努; 鈴木伸二; 山崎勝弘; 奥田健三
信学論, 電子情報通信学会, J73-D-I巻, 1号, 掲載ページ 9-17, 出版日 1990年01月, 査読付
研究論文(学術雑誌), 日本語 - A NETWORK-TOPOLOGY INDEPENDENT TASK ALLOCATION STRATEGY FOR PARALLEL COMPUTERS
T BABA; Y IWAMOTO; T YOSHINAGA
SUPERCOMPUTING 90, I E E E, COMPUTER SOC PRESS, 掲載ページ 878-887, 出版日 1990年, 査読付
研究論文(国際会議プロシーディングス), 英語 - A PARALLEL OBJECT-ORIENTED TOTAL ARCHITECTURE - A-NET
T BABA; T YOSHINAGA; T IIJIMA; Y IWAMOTO; M HAMADA; M SUZUKI
SUPERCOMPUTING 90, I E E E, COMPUTER SOC PRESS, 掲載ページ 276-285, 出版日 1990年, 査読付
研究論文(国際会議プロシーディングス), 英語
MISC
- オンデバイス階層連合学習フレームワークの性能解析
DU Zhaoyang; WU Celimuge; YOSHINAGA Tsutomu
出版日 2023年, 電子情報通信学会技術研究報告(Web), 123巻, 174(CQ2023 26-36)号, 2432-6380, 202302231592195804 - マスクされたオートエンコーダによるセマンティック通信:画像伝送の効率を向上
WU Jiale; DU Zhaoyang; WU Celimuge; YOSHINAGA Tsutomu
出版日 2023年, 電子情報通信学会技術研究報告(Web), 123巻, 174(CQ2023 26-36)号, 2432-6380, 202302286133140217 - 連合学習における知識蒸留と転移学習によるUAVネットワークに対する通信効率の強化
LI Yalong; DU Zhaoyang; WU Celimuge; YOSHINAGA Tsutomu
出版日 2023年, 電子情報通信学会技術研究報告(Web), 123巻, 174(CQ2023 26-36)号, 2432-6380, 202302286796191909 - フェデレーテッドラーニングを用いた自動運転手法
小野航輝; WU Celimuge; 吉永努
出版日 2023年, 電子情報通信学会技術研究報告(Web), 122巻, 438(CQ2022 80-106)号, 2432-6380, 202302230675097693 - モバイル分散協調キャッシュにおけるマルチホップD2D通信の活用
宮原雅司; 秋場大暉; 萩原賢; WU Celimuge; 吉永努
出版日 2023年, 電子情報通信学会技術研究報告(Web), 122巻, 451(CPSY2022 34-55)号, 2432-6380, 202302228620977562 - チャンク分割コンテンツ配置を用いた分散協調色キャッシュ (コンピュータシステム)
岡田 浩希; 城間 隆行; 中島 拓真; 策力木格; 吉永 努
電子情報通信学会, 出版日 2017年11月19日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 314号, 掲載ページ 3-8, 日本語, 0913-5685, 40021402233, AN10013141 - 色タグ情報に基づく分散協調キャッシュおよびチャンク分割キャッシュ制御のプロトタイプの実装 (コンピュータシステム)
中島 拓真; 岡田 浩希; 策力木格; 吉永 努
電子情報通信学会, 出版日 2017年11月19日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117巻, 314号, 掲載ページ 9-14, 日本語, 0913-5685, 40021402258, AN10013141 - Performance evaluation of RPL-based sensor data collection in challenging IoT environment (コミュニケーションクオリティ)
Gao Liming; Wu Celimuge; Yoshinaga Tsutomu
電子情報通信学会, 出版日 2017年01月19日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116巻, 403号, 掲載ページ 7-12, 英語, 0913-5685, 40021101994, AN1054106X - Reinforcement Learning-based Data Storage Scheme in Vehicular Ad Hoc Networks
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Tutomu Murase; Yan Zhang
IEEE, 出版日 2016年05月24日, Proc. of the IEEE International Conference on Communications (ICC) 2016, 掲載ページ 718-723, 英語, 査読付, 会議報告等 - 動画の人気変動に追従する異種キャッシュ混在ネットワークの検討 (コンピュータシステム) -- (組込み技術とネットワークに関するワークショップETNET2016)
中島 拓真; 城間 隆行; 吉見 真聡; 策力木格; 吉永 努
電子情報通信学会, 出版日 2016年03月24日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 115巻, 518号, 掲載ページ 247-252, 日本語, 0913-5685, 40020791009, AN10013141 - Design and Evaluation of Low-Latency Handshake Join on FPGA (コンピュータシステム) -- (組込み技術とネットワークに関するワークショップETNET2016)
YOSHIMI Masato; OGE Yasin; WU Celimuge; YOSHINAGA Tsutomu
電子情報通信学会, 出版日 2016年03月24日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 115巻, 518号, 掲載ページ 253-258, 英語, 0913-5685, 40020791018, AN10013141 - 活動60年を超えたコンピュータシステム研究会
吉永努
電子情報通信学会, 出版日 2014年05月01日, 電子情報通信学会情報・システムソサイエティ誌, 19巻, 1号, 掲載ページ 10-11, 日本語, 招待, その他, 130005433624 - 座位状態での心拍測定を用いたリアルタイムなストレス緩和システム—生体計測システム
佐久間大輝; 神田尚子; 吉見真聡; 吉永努; 入江英嗣
PCや携帯端末といったVDT機器の普及により、長時間座ってVDT作業を行う状況が増えている。それらの作業を過度に連続して行うと頭痛、肩こり、イライラ感などが発生し、効率や健康に悪影響を与えることが知られている。これらの蓄積にいち早くユーザが気づくことは難しい。このようなユーザの気づきにくい微妙な体調・心理状態について、例えばストレス状態を心拍変動解析によって推定するような研究が行われている。心拍に関して取得センサの小型化、実時間での解析手法、ストレスを数値化し可視化する研究が行われているが、まだその利用は一般的には浸透していない。小型軽量化した最新のセンサデバイスを用いて心拍変動を常時モニタリング・解析し、ストレス緩和のタイミングをユーザに示唆することができれば、現代社会に有効なライフサポートとなり、健康・仕事効率ともに増進できる。そこで、本論文ではストレス解析アルゴリズムとユーザ通知システムについて提案を行い、その効果を評価する。実験結果から、ストレスをユーザに可視化し通知することでしないときと比べ、ストレスが減少傾向をとることがわかった。, 出版日 2013年07月03日, マルチメディア、分散協調とモバイルシンポジウム2013論文集, 2013巻, 掲載ページ 1188-1195, 日本語, 170000079946
書籍等出版物
講演・口頭発表等
- FPGAを用いたキャッシュサーバにおけるリクエスト処理の低遅延実装
袁 天翊; 策力木格; 吉永努
信学技報, vol. 123, no. 450, CPSY2023-41, pp. 18-23
発表日 2024年03月21日
開催期間 2024年03月21日- 2024年03月23日 - モバイル分散協調キャッシュにおけるマルチホップD2D通信の活用
宮原雅司; 秋場大暉; 萩原賢; 策力木格; 吉永努
口頭発表(一般), 日本語, 信学技報, vol. 122, no. 451, CPSY2022-37, pp. 19-24,
発表日 2023年03月23日 - モバイル分散協調キャッシュにおけるユーザQoE向上のためのコンテンツ配置手法
秋場大暉; 策力木格; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会,信学技報, IEICE-CPSY2022-7, 電子情報通信学会, 下関, 国内会議
発表日 2022年07月28日 - A UAV-empowered Routing Protocol for Federated Learning in Delay Tolerant Environments
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
口頭発表(一般), 英語, IEICE Technical Report, CQ2021-55, 国内会議
発表日 2021年09月 - Load balancing method using reinforcement learning between edge and cloud
Hiroki Kobari; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
口頭発表(一般), 英語, IEICE Technical Report, CQ2021-38, IEICE, 国内会議
発表日 2021年09月 - FPGAを用いたデータベースクエリ処理の高速化
尾作洋彦; 吉見真聡; 策力木格; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会/信学技報CPSY2020-38, 電子情報通信学会, オンライン, https://www.ieice.org/ken/paper/20210126UC1M/, 国内会議
発表日 2021年01月26日 - 分散協調キャッシュサーバ処理のFPGAオフロード
山岸徹平; 吉見真聡; 策力木格; 吉永 努
口頭発表(一般), 日本語, SWoPP2020/CPSY2020-10, 電子情報通信学会, オンライン, https://www.ieice.org/ken/paper/20200731w1ZC/, 国内会議
発表日 2020年07月31日 - 視覚数理モデルシミュレーションの高速化と錯視画像の探索
柳田悠介; 佐藤俊治; 策力木格; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会,信学技法,ニューロコンピューティング研究会, 電子情報通信学会, 東京, 国内会議
発表日 2020年03月04日 - モバイル分散・協調キャッシュにおける事前プッシュ配信による通信量削減
城間隆行; 吉見真聡; 策力木格; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会 信学技法 コンピュータシステム研究会, 国内会議
発表日 2020年02月27日 - FPGAを用いたストリームデータ集約演算のウィンドウサイズ拡大
大坂誠樹; 吉見真聡; 策力木格; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会,CPSY研究会/信学技法 CPSY2020-01, 電子情報通信学会, 日吉, 国内会議
発表日 2020年01月23日 - Empowering ICN in Intermittent Connectivity Scenarios
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
口頭発表(一般), 英語, IEICE Society Conference 2019, IEICE, 国内会議
発表日 2019年09月 - モバイル分散協調キャッシュにおけるコンテンツ配置のテンプレート化
城間隆行; 策力木格; 吉永努
口頭発表(一般), 日本語, 信学技法,CPSY2019-38, 電子情報通信学会, 北見市, 国内会議
発表日 2019年07月26日 - A VDTN Routing Protocol with Enhanced Buffer Management Policy
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE General Conference 2019, IEICE, 国内会議
発表日 2019年03月 - A Vehicular DTN Routing Protocol with Enhanced Buffer Management Policy
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Technical Report, CQ2018-81, IEICE, 国内会議
発表日 2019年01月 - マルチノードFPGAを用いた低遅延ストリームデータ結合処理
松下紘嗣; 策力木格; 吉永努
口頭発表(一般), 日本語, 電子情報通信学会,信学技法,CPSY2018-17, 電子情報通信学会, 熊本, 国内会議
発表日 2018年07月31日 - A Prophet-based DTN protocol for VANETs
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Technical Report, CQ2018-24, 国内会議
発表日 2018年05月 - An Openflow-based Management Framework for Sensor and Actuator Networks
Rui Kang; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Tech. Report, CQ2017-87, IEICE, Tokyo, 国内会議
発表日 2018年01月18日 - 相互結合ネットワークとその計算システムに関する研究
吉永努
口頭発表(招待・特別), 日本語, コンピュータシステム研究会/信学技法CPSY2017-115, 招待, 電子情報通信学会, 日吉, 国内会議
発表日 2018年01月18日 - Evaluation on performance gain of an SDN-based handover approach in IEEE 802.11p and LTE hybrid vehicular networks
Ran Duo; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Tech. Report, CQ2017-86, IEICE, Tokyo, 国内会議
発表日 2018年01月18日 - チャンク分割コンテンツ配置を用いた分散協調色キャッシュ
岡田浩希; 城間隆行; 中島拓真; 策力木格; 吉永努
ポスター発表, 日本語, 電子情報通信学会/信学技法 CPSY2017-51, 電子情報通信学会, 国内会議
発表日 2017年11月19日 - 色タグ情報に基づく分散協調キャッシュおよびチャンク分割キャッシュ制御のプロトタイプの実装
中島拓真; 岡田浩希; 策力木格; 吉永努
ポスター発表, 日本語, 電子情報通信学会/信学技法 CPSY2017-52, 電子情報通信学会, 青森, 国内会議
発表日 2017年11月19日 - System Performance Assessment and Sizing for Cloud-based Data Backup
Yuichi Taguchi; Tsutomu Yoshinaga
口頭発表(一般), 英語, コンピュータシステム・シンポジウム (ComSys2017), 情報処理学会 システムソフトウェアとオペレーティング・システム研究会, 川崎市, http://www.ipsj.or.jp/sig/os/index.php?ComSys2017, 国内会議
発表日 2017年11月07日 - Performance Evaluation of Vehicular DTN Protocols for Anycast Vehicle-to-cloud Communications
Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Technical Report, CQ2017-52, IEICE
発表日 2017年08月 - アクセス変動予測を用いた分散協調キャッシュ制御
千田進; 城間隆行; 中島拓真; 策力木格; 吉永努
口頭発表(一般), 日本語, 信学技法,CPSY2017-23, 国内会議
発表日 2017年07月26日 - Content Distribution in VANETs Integrating LTE and IEEE 802.11p
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Tech. Report, CQ2017-14, IEICE, Miyazaki, http://www.ieice.org/ken/paper/201705293bTu/, In this paper, we discuss the use of integrating LTE (Long Term Evolution) and IEEE 802.11p for the content distribution in vehicular ad hoc networks (VANETs)., 国内会議
発表日 2017年05月29日 - デバイス間通信を活用する分散協調キャッシュ機構の提案
城間隆行; 中島拓真; 吉見真聡; 策力木格; 吉永 努
口頭発表(一般), 日本語, 信学技報,CPSY2016-159, 電子情報通信学会, 沖縄, 国内会議
発表日 2017年03月10日 - マルチノードFPGAによるストリームデータ分散結合処理
多田昂介
口頭発表(一般), 日本語, 信学技法CPSY2016-112, IEICE, yokohama, 国内会議
発表日 2017年01月23日 - Performance evaluation of RPL-based sensor data collection in challenging IoT environment
Liming Gao; Celimuge Wu; Tsutomu Yoshinaga
口頭発表(一般), 英語, IEICE Tech. Report, CQ2016-91, IEICE, Oosaka, 国内会議
発表日 2017年01月19日 - A Reinforcement Learning-based Data Storage Scheme for VANETs
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Tech. Report, CQ2016-92, IEICE, Oosaka, 国内会議
発表日 2017年01月19日 - ネットワーク結合型マルチFPGAボードを用いた集約演算クエリ処理
川原尚人; 吉見真聡; 策力木格; 吉永努
ポスター発表, 日本語, 信学技法 CPSY2016-49, 電子情報通信学会, 幕張, 国内会議
発表日 2016年10月06日 - A context-aware unified routing protocol for vehicular ad hoc networks
Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
口頭発表(一般), 英語, IEICE Tech. Report, CQ2016-64, IEICE, Tsukuba, We propose a context-aware unified routing protocol for vehicular ad hoc networks (VANETs). The proposed protocol constructs route based on virtual clustering which only exchanges beacon messages in one-hop neighborhood area. The packets are forwarded by the cluster heads, and the last 2-hop route is optimized by using a reinforcement learning algorithm which can attain good performance with low overhead. The advantage of the proposed protocol is shown by using computer simulations., 国内会議
発表日 2016年08月30日 - インタークラウドを活用した自動災害復旧システム
溝田敦也; 城間隆行; 中島拓真; 吉見真聡; 策力木格; 吉永 努
口頭発表(一般), 日本語, 信学技法,CPSY2016-34, 電子情報通信学会, 松本, 国内会議
発表日 2016年08月10日 - ネットワーク内キャッシュによるISPネットワーク通信電力の削減
野島幸大; 城間隆行; 中島拓真; 吉見真聡; 策力木格; 吉永 努
口頭発表(一般), 日本語, 信学技法,CPSY2016-33, 電子情報通信学会, 松本, 国内会議
発表日 2016年08月10日 - 動画の人気変動に追従する異種キャッシュ混在ネットワークの検討
中島拓真; 城間隆行; 吉見真聡; 策力木格; 吉永努
口頭発表(一般), 日本語, 信学技法,CPSY2015-154, 電子情報通信学会, 長崎, 本論文では,動画の人気が急激に変動した際にも高いヒット率を維持するために,ヒット率の高いLFU キャッシュで通信量を削減しつつ,アクセスの急激な変動に強いLRU キャッシュを少量組み合わせて,ヒット率の低下を抑制する.LRU とLFU を混在させた階層ャッシュネットワークでシミュレーションを行い,異種キャッシュを混在させたキャッシュネットワークは急激な人気変動に追従して高いヒット率と短いホップ数を維持できることを確認した., 国内会議
発表日 2016年03月25日 - Design and Evaluation of Low-Latency Handshake Join on FPGA
Masato YOSHIMI; Yasin OGE; Celimuge Wu; Tsutomu YOSHINAGA
口頭発表(一般), 英語, IEICE, Tech. Report, CPSY2015-155, IEICE, Nagasaki, In this paper, we propose an FPGA-based implementation of low-latency handshake join algorithm and present a detailed evaluation of the proposed design., 国内会議
発表日 2016年03月25日 - Reinforcement learning-based parameter tuning for a broadcast protocol in VANETs
Celimuge Wu; Satoshi Ohzahata; Yusheng Ji; Tsutomu Yoshinaga; Toshihiko Kato
口頭発表(一般), 英語, IEICE Tech. Report CQ2015-105, IEICE, Tsukuba, http://www.ieice.org/ken/paper/20160122zbfW/, In this paper, we present a broadcast protocol which is able to make forwarding decision based on a self-learning mechanism., 国内会議
発表日 2016年01月21日 - データストリーム集約演算HWの並列化
小川芳光; オゲヤースィン; 吉見真聡; 策力木格; 吉永努
口頭発表(一般), 日本語, 信学技法 CPSY2015-119, 電子情報通信学会, 横浜, 国内会議
発表日 2016年01月19日 - 3次元積層プロセッサ向けフロアプランナの可視化
村田篤志; 野村隼人; 吉見真聡; 入江英嗣; 吉永 努; 坂井修一
その他, 日本語, 信学技報CPSY2015-58, 電子情報通信学会, 幕張, 国内会議
発表日 2015年10月08日 - RGB-Dセンサと学習による運転姿勢検知
土門憲司; 野村隼人; 吉見真聡; 入江英嗣; 吉永 努; 坂井修一
その他, 日本語, 信学技報CPSY2015-59, 電子情報通信学会, 幕張, 国内会議
発表日 2015年10月08日 - Stubborn Cache: A Novel Strategy for Repeating Thrashing Access Patterns
Hayato Nomura; Takuma Nakajima; Masato Yoshimi; Tsutomu Yoshinaga; Hidetsugu Irie
ポスター発表, 英語, Proceedings Notebook for COOL Chips XVIII, 国際会議
発表日 2015年04月13日 - TSVモジュールの配置最適化アルゴリズムの提案
村田篤志; 稲場朋大; 吉見真聡; 入江英嗣; 吉永 努
口頭発表(一般), 日本語, CPSY研究会/信学技報, 電子情報通信学会, 奄美市, 3 次元積層技術の進展によりVLSI の性能や電力を大きく改善することが期待されている.設計最適化のための3 次元フロアプランナのアルゴリズムが様々に提案されているが,TSV の配置について従来手法では近似がされており,最適化は正確ではない.そこで本論文では,TSV をモジュール同様に配置最適化するアルゴリズムを提案
する.提案アルゴリズムを実装して得られた3 次元プロセッサのフロアプランでは有効なTSV 位置には傾向があることが示され,配線アクティビティについて従来よりも28.4%正確な見積もりで最適化ができることがわかった., 国内会議
発表日 2015年03月15日 - 複数FPGAボードを用いたビッグデータ分割処理の高速化
工藤 龍; 須戸里織; オゲ ヤースィン; 寺田祐太; 吉見真聡; 入江英嗣; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会CPSY研究会/信学技法, 電子情報通信学会, 横浜, http://www.ieice.org/ken/program/index.php?tgs_regid=53077ae37f63d6d92da5a8fedb26a5e56da654fe71ed80dd51e298c078687e7a&tgid=IEICE-CPSY&lang=, 本研究報告では,生命科学における配列類似性検索を対象に塩基配列データベースを分散配置するハードウェアを実装し,評価した結果について議論する., 国内会議
発表日 2015年01月30日 - コンテンツピース毎のアクセス頻度によるWeb キャッシュ機構の構築
城間隆行; 中島拓真; 吉見真聡; 入江英嗣; 吉永努
ポスター発表, 日本語, 電子情報通信学会/コンピュータシステム研究会CPSY2014-92, 電子情報通信学会, 東京, 本研究報告では,動画コンテンツ内のアクセス頻度の差に着目し,動画を分割したコンテンツピースを対象にキャッシュ制御を行うことで,効率的にデータ配信を行うキャッシュ機構を提案する., 国内会議
発表日 2014年12月01日 - SDNによるWeb キャッシュサーバ間通信の効率化
中島拓真; 吉見真聡; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 電子情報通信学会/コンピュータシステム研究会CPSY2014-59, 電子情報通信学会, 広島, http://www.ieice.org/ken/program/index.php?tgs_regid=0798faabdcdbe96efdb8ecc9bf1160946c02a0ad149b4213fb7af78655239c98&tgid=IEICE-CPSY&lang=, 通信速度向上と通信量削減を同時に実現することを目的として,広帯域な経路を動的に選択する経路制御を開発し,Web キャッシュサーバ間通信の効率化手法を提案する., 国内会議
発表日 2014年11月13日 - AirTargetシステムにおけるカーソルの予測描画によるUIの改善
中島嵩文; 千竃航平; 岩崎 央; 吉見真聡; 入江英嗣; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会/信学技法, 電子情報通信学会, 幕張, http://www.ieice.org/ken/paper/20141010kBSe/, 国内会議
発表日 2014年10月10日 - 相対チェックポイントを用いた運転者支援の検討
土門憲司; 吉見真聡; 入江英嗣; 吉永 努
口頭発表(一般), 日本語, 電子情報通信学会/信学技法 CPSY2014-47, 電子情報通信学会, 幕張, 国内会議
発表日 2014年10月10日 - STRAIGHTシミュレータによるループ実行の評価
佐保田 誠; 山中 崇弘; 吉見 真聡; 吉永 努; 入江 英嗣
ポスター発表, 日本語, 情報処理学会/研究報告, 情報処理学会, 別府, http://www.ipsj.or.jp/sig-reports/ARC/ARC212.html, 国内会議
発表日 2014年10月07日 - プリフェッチ精度に基づくキャッシュライン保持手法
力 翠湖; 吉見 真聡; 吉永 努; 入江 英嗣
口頭発表(一般), 日本語, 情報処理学会/研究報告, 情報処理学会, 別府, http://www.ipsj.or.jp/sig-reports/ARC/ARC212.html, 国内会議
発表日 2014年10月06日 - 動的推定によるキャッシュパーティショニング最適化
野村 隼人; 力 翠湖; 吉見 真聡; 吉永 努; 入江 英嗣
口頭発表(一般), 日本語, 情報処理学会研究報告, 情報処理学会, 新潟, http://www.ipsj.or.jp/sig-reports/ARC/ARC211.html, 国内会議
発表日 2014年07月28日 - Smith-Watermanアルゴリズム向けビット並列手法の検討
須戸里織; 吉見真聡; 入江英嗣; 吉永 努
口頭発表(一般), 日本語, 信学技法/電子情報通信学会,CPSY2013-90
発表日 2014年01月 - クラウド環境における透過的データアクセスと計算リソースの動的共有手法
中島拓真; 吉見真聡; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 信学技法/電子情報通信学会,CPSY2013-55
発表日 2013年11月 - HMD端末単体で動作する指先認識アルゴリズムの性能評価
千竃航平; 岩崎央; 森田光貴; 吉見真聡; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 信学技報 CPSY2013-37,コンピュータシステム研究会
発表日 2013年10月 - 光学シースルー方式HMD に適した直観的ジェスチャーUI
岩崎 央; 千竃 航平; 森田 光貴; 吉見 真聡; 入江 英嗣; 吉永 努
口頭発表(一般), 日本語, 信学技報 CPSY2013-38,コンピュータシステム研究会
発表日 2013年10月 - 省エネルギーな分散処理システムのための専用ハードウェアの設計
吉見真聡; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 再生可能集積システム時限研究会報告/電子情報通信学会,第8回 再生可能集積システム時限研究会
発表日 2013年10月 - 座位状態での心拍測定を用いたリアルタイムなストレス緩和システム
佐久間 大輝; 神田 尚子; 吉見 真聡; 吉永 努; 入江 英嗣
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア、分散、協調とモバイル(DICOMO2013)シンポジウム, 情報処理学会, 北海道
発表日 2013年07月 - タッチ指示によるお供ロボットナビゲーション
小野澤 清人; 芝 星帆; 吉永 努; 入江 英嗣
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2013)シンポジウム, 情報処理学会, 北海道
発表日 2013年07月 - プリフェッチ情報から再参照予測を行うキャッシュライン置き換えアルゴリズム
力翠湖; 眞島一貴; 藤原大輔; 吉見真聡; 吉永努; 入江英嗣
口頭発表(一般), 日本語, ARC研究報告/情報処理学会,SWoPP 2013
発表日 2013年07月 - 相対座標を用いた運動指導システム
黒田 修平; 放地 宏佳; 吉見 真聡; 吉永 努; 入江 英嗣
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2013)シンポジウム, 情報処理学会, 北海道
発表日 2013年07月 - もしILPプロセッサのレジスタファイルが分散キーバリューストアになったら
入江英嗣; 山中崇弘; 佐保田誠; 吉見真聡; 吉永努
口頭発表(一般), 日本語, ARC研究報告/情報処理学会,SWoPP 2013
発表日 2013年07月 - FPGA-based Implementation of Sliding-Window Aggregates over Data Streams
Yasin OGE; Masato YOSHIMI; Takefumi MIYOSHI; Hideyuki KAWASHIMA; Hidetsugu IRIE; Tsutomu YOSHINAGA
口頭発表(一般), 英語, CPSY2012-74
発表日 2013年01月 - 配線アクティビティを考慮した3次元積層プロセッサ向けフロアプランナーのための熱評価手法
稲場朋大; 放地宏佳; 藤原大輔; 眞島一貴; 吉見真聡; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 情報処理学会研究報告
発表日 2013年01月 - 色彩環境下での心拍変動との作業能率の相関に関する検討
神田尚子; 佐久間大輝; 吉永努; 入江英嗣
シンポジウム・ワークショップパネル(公募), 日本語, 第20回インタラクティブシステムとソフトウェアに関するワークショップ, 日本ソフトウェア科学会
発表日 2012年12月 - 顔検出とエッジ抽出を利用した携帯端末による自撮り支援システムの提案
芝星帆; 入江英嗣; 吉永努
シンポジウム・ワークショップパネル(公募), 日本語, 日本ソフトウェア科学会, 青森
発表日 2012年12月 - スマートフォンによる歩行動作分析の評価
樫原 裕大; 清水 裕基; 吉永 努; 入江 英嗣
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2012)シンポジウム, 情報処理学会, 加賀市
発表日 2012年07月 - レーザー光を利用したデバイス間通信における直観的な接続方法の提案
小木 真人; 大木 裕太; 吉永 努; 入江 英嗣
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2012)シンポジウム, 情報処理学会, 加賀市
発表日 2012年07月 - ネットワークコンピューティングのための包括的マッシュアップフレームワークIDUMOの設計
放地 宏佳; 三好 健文; 入江 英嗣; 吉永 努
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2012)シンポジウム, 情報処理学会, 加賀市
発表日 2012年07月 - TCPセッションへの識別子付与による複数プロセス横断可能な処理追跡法
清水 裕基; 三好 健文; 入江 英嗣; 吉永 努
シンポジウム・ワークショップパネル(公募), 日本語, 第23回 コンピュータシステム・シンポジウム (ComSys 2011), 情報処理学会, 京都
発表日 2011年12月 - スマートフォンを用いた歩行動作改善ツールの開発
樫原裕大; 清水裕基; 三好健文; 吉永努; 入江英嗣
口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム研究会
発表日 2011年11月 - ネットワークコンピューティングのための包括的マッシュアップフレームワークの検討
放地宏佳; 三好健文; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム(UBI)研究会
発表日 2011年11月 - 覗き込みを利用した直感的な外部ディスプレイアクセス方式の提案
小木真人; 清水裕基; 三好健文; 吉永努; 入江英嗣
口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム(UBI)研究会
発表日 2011年11月 - 関連データ先読みとスマートフォンの消費電力に関する研究
小貫貴央; 神田尚子; 放地宏佳; 吉永 努; 入江英嗣
口頭発表(一般), 日本語, 第10回情報科学技術フォーラムFIT2011
発表日 2011年09月 - 視覚神経系モデルシミュレーションの複数GPUによる高速化
大村純一; 佐藤俊治; 江頭明; 三好健文; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 情報処理学会研究報告,HPC研究会
発表日 2011年07月 - MPIを埋め込み可能なGPUプログラミングフレームワーク適用可能性の評価
島圭吾; 三好健文; 近藤正章; 入江英嗣; 本多弘樹; 吉永努
口頭発表(一般), 日本語, 信学技報,CPSY研究会2011-17
発表日 2011年07月 - 視覚神経系数理モデルシミュレーションのMPIによる並列化
齋藤祐典; 佐藤俊治; 大村純一; 三好健文; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 情報処理学会研究報告,HPC研究会
発表日 2011年05月 - MPIを埋め込み可能なGPUプログラミングフレームワークの検討
三好健文; 近藤正章; 入江英嗣; 吉永努; 本多弘樹
シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウムSACSIS2011, 情報処理学会, 東京
発表日 2011年05月 - 3次元積層プロセッサ向けブロック配置問題の検討
松村雄貴; 三好健文; 吉永努; 入江英嗣
口頭発表(一般), 日本語, 情報処理学会研究報告,ARC研究会
発表日 2011年04月 - クラウドによる携行可能な指先での署名認証システムの開発
寺西良太; 三好健文; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム研究会(UBI)
発表日 2011年03月 - 動的再構成可能ストリーム処理エンジンとクエリコンパイラの検討
三好健文; 寺田祐太; 川島英之; 吉永努
シンポジウム・ワークショップパネル(公募), 日本語, 第52回プログラミングシンポジウム, 情報処理学会, 熱海市
発表日 2011年01月 - FPGAを用いたデータストリームに対するウィンドウジョインの検討
寺田祐太; 三好健文; 川島英之; 吉永努
口頭発表(一般), 日本語, 信学技報/電子情報通信学会,Reconf2010-80
発表日 2011年01月 - メニーコア時代に向けたインオーダ・アーキテクチャ再考
三好健文; 入江英嗣; 松村雄貴; 吉永 努
口頭発表(一般), 日本語, 信学技報/電子情報通信学会,CPSY研究会(CPSY2010-36)
発表日 2010年12月 - PCクラスタによる行動支援サービスプラットフォームZeoBroの初期実装と評価
田島裕太; 三好健文; 秋岡明香; 後藤達弥; 入江英嗣; 吉永 努
口頭発表(一般), 日本語, 信学技報/電子情報通信学会,情報ネットワーク研究会(IN2010-93)
発表日 2010年11月 - 携帯端末とネットワーク上計算資源の協調によるカメラセンサアプリ高速化の検討
高橋信宏; 入江英嗣; 吉永 努; 寺西良太; 清水裕基
口頭発表(一般), 日本語, 情報処理学会,第9回科学技術フォーラムFIT2010
発表日 2010年09月 - コンパイラとランタイムによるソフトウェアキャッシュの更新オーバヘッド隠蔽手法
三好健文; 吉瀬謙二; 入江英嗣; 吉永努
口頭発表(一般), 日本語, 情報処理学会研究報告,ARC研究会
発表日 2010年08月 - 携帯端末のセンサ及び画像を用いたコンテンツ紐付け手法に関する提案
藤本 数矢; 寺西 良太; 吉永 努; 入江 英嗣; 三好 健文; 鈴木 良宏
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2010)シンポジウム, 情報処理学会, 岐阜
発表日 2010年07月 - 資源情報の特徴抽出によるモデル化手法と攻撃検知法の提案
清水裕基; 菅谷みどり; 秋岡明香; 吉永 努
口頭発表(一般), 日本語, 情報処理学会,創立50周年記念(第72回)全国大会
発表日 2010年03月 - パターン学習を用いた未知のSQLインジェクション攻撃検知システム
八木達哉; 秋岡明香; 吉永 努
口頭発表(一般), 日本語, 情報処理学会,創立50周年記念(第72回)全国大会
発表日 2010年03月 - Computer Aided Detection System Implementation for Mammograms over a FPGA
Yessica Suarez Henandez; Sayaka Akioka; Tsutomu Yoshinaga; Gonzalo Duchen Sanchez; Volodymyr Ponomaryov
口頭発表(一般), 英語, IEICE-RECONF2009-62
発表日 2010年01月 - 予測ルータによる低遅延Fat Treeネットワーク
館下智明; 秋岡明香; 吉永努; 松谷宏紀; 鯉渕道紘
口頭発表(一般), 日本語, ARC研報/情報処理学会,計算機アーキテクチャ研究会
発表日 2009年08月 - 細粒度リソース監視による攻撃検出手法の提案と考察
清水裕基; 菅谷みどり; 秋岡明香; 吉永 努
口頭発表(一般), 日本語, ソフトウェア科学会,第26回大会
発表日 2009年08月 - Prediction Switching for Photonic Network-on-chip
Cisse Ahmadou Dit ADI; Hiroki Matsutani; Michihiro Koibuchi; Sayaka Akioka; Tsutomu Yoshinaga
口頭発表(一般), 英語, ARC研報/情報処理学会,第176回計算機アーキテクチャ研究会
発表日 2009年08月 - 位置情報を媒体としたWebコミュニケーションツールの開発
後藤 達弥; 秋岡 明香; 吉永 努
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2009)シンポジウム, 情報処理学会, 別府
発表日 2009年07月 - DLNA情報家電の遠隔接続およびWebアプリケーションへの応用
深田 将史; 小山 卓視; 秋岡 明香; 吉永 努; 鈴木 良宏
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO 2009)シンポジウム, 情報処理学会, 別府
発表日 2009年07月 - 低遅延オンチップネットワークのための予測ルータの評価
松谷宏紀; 鯉渕道絋; 天野英晴; 吉永努
シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウムSACSIS 2009, 情報処理学会, 広島
発表日 2009年05月 - マルチリンクEthernet環境におけるSMPクラスタの性能評価
小林智史; Shan Axida; 吉永努
口頭発表(一般), 日本語, 情報処理学会,第71回全国大会
発表日 2009年03月 - 低遅延オンチップネットワークのための予測ルータの評価
松谷宏紀; 鯉渕道紘; 天野英晴; 吉永 努
口頭発表(一般), 日本語, 情報処理学会、計算機アーキテクチャ研究会,2009-ARC-181
発表日 2009年01月 - Mechanism for Sharing Media Content in Multiple Home Network Environments
JingYuan Wu; Tsutomu Yosinaga; Daigo Muto; Takumi Koyama
口頭発表(一般), 英語, 2008-UBI-19
発表日 2008年07月 - DMPで操作するDLNA機器とテレビ放送の遠隔視聴システムの提案
小山卓視; 武藤大悟; 吉永 努
シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア、分散、協調とモバイル(DICOMO2008)シンポジウム, 情報処理学会, 札幌
発表日 2008年07月 - 予測機構を持つルータを用いた低遅延ネットワークオンチップに関する研究
鯉渕 道紘; 吉永 努; 村上 弘和; 松谷 宏紀; 天野 英晴
シンポジウム・ワークショップパネル(公募), 日本語, SACSIS 2008, 情報処理学会, つくば
発表日 2008年06月 - 予測機構を持った低遅延オンチップルータアーキテクチャ
松谷宏紀; 鯉渕道紘; 天野英晴; 吉永 努
口頭発表(一般), 日本語, 情報処理学会,計算機アーキテクチャ研究会
発表日 2008年05月 - Pipelined Round-Robin Broadcast Algorithm in Homogeneous Clusters of SMP
Axida; T. Q. Viet; T. Yoshinaga
口頭発表(一般), 英語, HOKKE-2008
発表日 2008年03月 - Mobile-WormholeDevice: DLNA情報家電の相互遠隔接続支援機構の携帯端末への応用
小山卓視; 武藤大悟; 呉 敬源; 吉永 努
口頭発表(一般), 日本語, 情報処理学会研究報告,第44回モバイルコンピューティングとユビキタス通信・第17回ユビキタスコンピューティングシステム合同研究発表会
発表日 2008年03月 - 通信予測機構を用いた低遅延ネットワークの構成方法と評価
村上弘和; 吉永努; 鯉渕道紘
口頭発表(一般), 日本語, 計算機アーキテクチャ研究会報告,第167回 情報処理学会 計算機アーキテクチャ研究会 (ARC)
発表日 2007年11月 - ワームホールデバイス:DLNA情報家電の遠隔相互接続支援機構
武藤大悟; 吉永努
口頭発表(一般), 日本語, 情報処理学会,マルチメディア,分散,協調とモバイルシンポジウムアブストラクト集
発表日 2007年07月 - 2-D トーラスネットワークにおける動的通信予測の効果
吉永努; 村上弘和; 鯉渕道紘
シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウムSACSIS2007, 情報処理学会, 東京
発表日 2007年05月 - 耐故障ネットワークルーティングに対するスロットリングに関する考察
村上弘和; 鎌倉正司郎; 吉永努
口頭発表(一般), 日本語, 情報処理学会第69回全国大会論文集,情報処理学会第67回全国大会
発表日 2007年03月 - 情報家電ネットワークの遠隔相互接続のためのネットワークアーキテクチャ
武藤大悟; 吉永努
口頭発表(一般), 日本語, 情報処理学会第69回全国大会論文集,情報処理学会第67回全国大会
発表日 2007年03月 - Analysis of Prediction Accuracy for Communications on k-ary n-cubes
T. Yoshinaga; M. Koibuchi; S. Kamakura
シンポジウム・ワークショップパネル(公募), 英語, 10th Int. Workshop on Innovative Architecture for Future Generation High-Performance Processors and Systems (IWIA07), Maui, Hawaii
発表日 2007年01月 - Output Port Prediction for Messages in 2-D Torus Routers
T. Yoshinaga
シンポジウム・ワークショップパネル(公募), 英語, Tunisia-Japan Symposium on Society, Science and Technology 2006, Borj-Cedria Science and Technology Park, Tunisia, and ARENA of the University of Tsukuba, Sousse
発表日 2006年12月 - 2Dトーラスネットワークにおける動的予測ルーティング
鎌倉正司郎; 吉永努; 鯉渕道紘
口頭発表(一般), 日本語, 計算機アーキテクチャ研究会報告(2006-ARC-169)/情報処理学会,計算機アーキテクチャ研究会(2006-ARC-169)
発表日 2006年08月 - 耐故障・適応ルーティングの自動チューニングに関する研究
西村康彦; 鎌倉正司郎; 吉永努; 鯉渕道紘
シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウム SACSIS06, 情報処理学会・計算機アーキテクチャ研究会他, 大阪
発表日 2006年05月 - Improving Linpack Performance on SMP Clusters with Asynchronous MPI Programming
T. Q. Viet; T. Yoshinaga
シンポジウム・ワークショップパネル(公募), 英語, Symposium on Advanced Computing Systems and Infrastructures (SACSIS), IPSJ SIG ARC, IEICE SIG Computer System, etc., Oosaka
発表日 2006年05月 - 2Dトーラスネットワークにおける通信方向予測ルーティング
鎌倉正司郎; 西村康彦; 吉永努; 鯉渕道紘
口頭発表(一般), 日本語, 情報処理学会,第68回大会
発表日 2006年03月 - Dynamic Tuning Impact on a Fault-Tolerant and Adaptive Routing Function
T. Yoshinaga; Y. Nishimura
シンポジウム・ワークショップパネル(公募), 英語, The 6th Tunisian Japanese Seminar on Culture, Science and Technology, Borj Cedria Science and Technology Park, Tunisia, and ARENA of the University of Tsukuba, Sousse
発表日 2005年11月 - Performance Enhancement for Matrix Multiplication on an SMP PC Cluster
Ta Quoc Viet; Tsutomu Yoshinaga; Ben A. Abderazek
口頭発表(一般), 英語, 2005-HPC-103 (SWoPP 05)
発表日 2005年08月 - 耐故障・適応ルーティングのためのネットワーク再構成プロトコルの評価
吉永努; 西村康彦; 曽和将容
口頭発表(一般), 日本語, 先進的計算基盤システムシンポジウム
発表日 2005年05月 - 耐故障・適応ルーティングのセルフチューニングに関する検討
西村康彦; 吉永努; 曽和将容
口頭発表(一般), 日本語, 電子情報通信学会 技術研究報告, CPSY2005-4,Vol.105, No.3
発表日 2005年04月 - キャンパスP2Pネットワークにおけるパーソナライズド検索
杉原健司; 志田匡士; 吉永努; 曽和将容
口頭発表(一般), 日本語, 電子情報通信学会技術研究報告,組み込み技術とネットワークに関するワークショップ
発表日 2005年03月 - Rapid FPGA Prototyping of a Queue Processor Core for Embedded Computing
B. A. Abderazek; T. Yoshinaga; M. Sowa
口頭発表(一般), 英語, IPSJ 67th Annual Convention
発表日 2005年03月 - 生産順序キューマシン命令コード生成手法の提案
川島祐介; 繁田聡一; 吉永努; 曽和将容
口頭発表(一般), 日本語, 第67回全国大会
発表日 2005年03月 - 耐故障Detour-UDルーティングアルゴリズムのシミュレーションによる評価
船山裕右; 戸村元; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会 第67回全国大会 講演論文集
発表日 2005年03月 - k-ary n-cube ネットワークの輻輳回避ルーティングに関する検討
西村康彦; 戸村元; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会 第67回全国大会 講演論文集
発表日 2005年03月 - JXTAを用いたP2Pネットワークにおける認証機能委託と知的検索
志田匡士; 杉原健司; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会 第67回全国大会 講演論文集
発表日 2005年03月 - A General Purpose Assembler for Queue Computers
A. Canedo; B. A. Abderazek; 吉永努; 曽和将容
口頭発表(一般), 英語, 67th IPSJ Annual Convention
発表日 2005年03月 - 並列キュー計算モデルの理論的特性評価
Halcham Kutluk; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第67回全国大会
発表日 2005年03月 - 生産型キュープロセッサの実用化に関する研究
仲谷陵; Ben A. Abderazek; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第67回全国大会
発表日 2005年03月 - FaRMqs: Hybrid Processor Architecture in Verilog-HDL
M. M. Akanda; Abderazek Ben; 吉永努; 曽和将容
口頭発表(一般), 英語, 67th Annual Convention
発表日 2005年03月 - Verilog-HDLによる並列キュープロセッサのデザイン
三好崇之; ABDERAZEK Ben; 繁田聡一; 吉永努; 曽和将容
口頭発表(一般), 日本語, 第3回情報科学技術フォーラムFIT04講演論文集
発表日 2004年09月 - Optimization for Hybrid MPI-OpenMP Programs with Thread-to-thread Communication
Ta Quoc Viet; Tsutomu Yoshinaga; Masahiro Sowa
口頭発表(一般), 英語, 電子情報通信学会 技術研究報告
発表日 2004年07月 - 並列キュー計算モデルの基本特性評価
Halcham Kutluk; Ben A. Abderazek; 繁田聡一; 吉永努; 曽和将容
口頭発表(一般), 日本語, 電子情報通信学会技術研究報告
発表日 2004年07月 - 耐故障性を考慮した k-ary n-cube 用デッドロック回復ルーティング
吉永努; 細越洋行; 曽和将容
口頭発表(一般), 日本語, 先端的計算基盤システムシンポジウム論文集
発表日 2004年05月 - 動的故障に対応する並列計算機用適応ルータに関する検討
戸村元; 細越洋行; 吉永努; 曽和将容
口頭発表(一般), 日本語, 電子情報通信学会 技術研究報告, CPSY2004-8,Vol.104, No.12
発表日 2004年04月 - QJavaプロセッサの設計とVerilogシミュレータによる動作検証
阿部俊輔; 繁田聡一; B. A. Abderazek; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
発表日 2004年03月 - 2バイト固定命令長キューマシンアーキテクチャの性能評価
山崎淳一; B. A. ABDERAZEK; 繁田聡一; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
発表日 2004年03月 - 生産順序キューマシン命令コード生成手法の提案
川島祐介; Ben A. Abderazek; 繁田聡一; 吉永 努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
発表日 2004年03月 - 同時マルチスレッディング(SMT)技術を用いたマルチスレッド並列キュープロセッサのハードウエア設計
佐々木博敏; 奥村義智; B. A.Abderazek; 繁田聡一; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
発表日 2004年03月 - Queue Computation Mechanism For Parallel execution in Parallel Queue Processor
M. M. Akanda; B. A. Abderazek; 繁田聡一; 吉永努; 曽和将容
口頭発表(一般), 英語, 66th IPSJ Annual Convention
発表日 2004年03月 - プレゼンス情報によるP2Pネットワーク支援
杉原健司; Xuanhoa Tran; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会 第66回大会
発表日 2004年03月 - PQPpfB: Parallel Queue Processor Architecture in Verilog-HDL
B. A. Abderazek; M. Arsenji; K. Kiuchi; M. M. Akanda; S. Shigeta; T. Yoshinaga; M. Sowa
口頭発表(一般), 英語, 66th IPSJ Annual Convention
発表日 2004年03月 - Instruction Set Architecture for Parallel Queue Processor
M. Arsenij; B. A. Abderazek; S. Shigeta; H. Kutluk; M. Sowa; T. Yoshinaga
口頭発表(一般), 英語, 66th IPSJ Annual Convention
発表日 2004年03月 - 生産順序型並列キュープロセッサのための効率的な命令発行のメカニズム
木内和之; Ben Abderazek; 繁田聡一; 曽和将容; 吉永努
口頭発表(一般), 日本語, 情報処理学会,第66回大会
発表日 2004年03月 - キュー実行方式に基づくキューJava仮想マシンの実現
茂野収; 繁田聡一; B. A. Abderazek; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
発表日 2004年03月 - QJava VMの実装と動作検証
柳下伸幸; 繁田聡一; B. A. Abderazek; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
発表日 2004年03月 - Design of Producer-order Parallel Queue Processor Architecture
Arsenij Markovskij; Masahiro Sowa; Ben Abderazek; Soichi Shigeta; Tsutomu Yoshinaga
口頭発表(一般), 英語, Technical Report of IEICE, CPSY2003-26
発表日 2004年01月 - JXTAネットワークに対するユーザ認証およびアクセス制御の導入
Xuanhoa Tran; 杉原健司; 吉永努; 曽和将容
口頭発表(一般), 英語, 情報処理学会、コンピュータセキュリティ研究会、研究報告
発表日 2003年12月 - Reduced Bit-Width Instruction Set Architecture for Q-mode Execution in Hybrid Processor Architecture (FaRM-rq)
Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
口頭発表(一般), 英語, IPSJ SIG Technical Reports, HPC
発表日 2003年06月 - An Ambiguous, Context-Free Grammar for Deterministic Parsing In Queue-Java Compiler
Li. Qiang Wang; Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
口頭発表(一般), 英語, IPSJ SIG Technical Report, HPC
発表日 2003年06月 - バイトコードレベルの高い並列性を持つQJavaの提案
繁田聡一; 王立強; Ben A. Abderazek; 吉永努; 曽和将容
口頭発表(一般), 日本語, 先端的計算基盤システムシンポジウム論文集
発表日 2003年05月 - Fast, Effective Instruction Generation Algorithm for Queue-Java Compiler (QJAVAC)
Li. Qiang Wang; Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
口頭発表(一般), 英語, IPSJ SIG Technical Report, ARC-153
発表日 2003年05月 - 耐故障性を備えた完全適応ルータの設計
細越洋行; 水戸部理; 吉永努; 曽和将容
口頭発表(一般), 日本語, 先端的計算基盤システムシンポジウム論文集
発表日 2003年05月 - A Hybrid MPI-OpenMP Solution for a Linear System on a Cluster of SMPs
Ta Quoc Viet; Tsutomu Yoshinaga; Ben A. Abderazek; Masahiro Sowa
口頭発表(一般), 英語, Proc. Symposium on Advanced Computing Systems and Infrastructures
発表日 2003年05月 - QJavaプロセッサの基本設計
繁田 聡一; 阿部俊輔; B. A. Abderazek; 吉永 努; 曽和 将容
口頭発表(一般), 日本語, 電子情報通信学会、信学技報(CPSY)
発表日 2003年04月 - Jiniネットワークへのアクセス制御機能の導入
宮本幹大; Hoa Tran Xuan; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会第65回全国大会
発表日 2003年03月 - 迂回制御を考慮した適応ルータの設計
細越洋行; 水戸部理; 吉永努; 曽和将容
口頭発表(一般), 日本語, 第6回システムLSIワークショップ資料集
発表日 2002年11月 - 並列キュープロセッサの基本設計
B. A. Abderazek; 繁田 聡一; K. Nikolova; 吉永 努; 曽和 将容
口頭発表(一般), 日本語, 電子情報通信学会技術研究報告(CPSY)
発表日 2002年11月 - SMPクラスタにおけるハイブリッドMPI-OpenMPプログラミングのためのマスタ-スレーブアルゴリズム
Ta Quoc Viet; Tsutomu Yoshinaga; Masahiro Sowa
口頭発表(一般), 英語, 情処学研報HPC
発表日 2002年08月 - 適応ルーティングを用いたPCクラスタ用ネットワークスイッチの提案
水戸部理; 吉永努; 曽和 将容
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP2002
発表日 2002年05月 - 仮想チャネル接続の違いによるルータの性能比較
水戸部理; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会第64回大会3ZB-3
発表日 2002年03月 - キュー構文木を用いたJavaコンパイラ
王立強; 吉永努; 曽和将容
口頭発表(一般), 日本語, 情報処理学会第64回大会5ZB-02
発表日 2002年03月 - マルチFPGAベース・カスタム計算機による医療用画像処理
横田隆史; 永淵雅道; 目加田慶人; 吉永努; 大津金光; 馬場敬信
口頭発表(一般), 日本語, FPGA/PLD Design Conference論文集
発表日 2002年01月 - 並列デッドロック回復ルータRecover-XのLSI試作
御代田雅俊; 吉永努; 横田隆史; 大津金光; 馬場敬信
口頭発表(一般), 日本語, 信学技報(ICD2001-69)
発表日 2001年08月 - 並列FPGAシステムによる医療用画像処理の高速化
永淵雅道; 吉永努; 横田隆史; 大津金光; 馬場敬信
口頭発表(一般), 日本語, 信学技報(CPSY2001-44)
発表日 2001年07月 - 異なるプラットフォームにおける受信メッセージ予測法の性能評価
足立涼子; 岩本善行; 大津金光; 吉永 努; 馬場敬信
口頭発表(一般), 日本語, 情報処理学会研究報告
発表日 2000年09月 - 適応ルータにおける最適な仮想チャネル数に関する考察
堀田真貴; 吉永 努; 大津金光; 馬場敬信
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP2000
発表日 2000年06月 - SOCノードで構成する並列計算機の性能評価
古川文人; 大津金光; 吉永 努; 馬場敬信
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP2000
発表日 2000年06月 - 並列デッドロック回復ルータRecover-xの性能評価
林匡哉; 堀田真貴; 中村さゆり; 吉永努; 大津金光; 馬場敬信
口頭発表(一般), 日本語, 情処学ARC研報
発表日 2000年 - 適応ルータの効率的な並列デッドロックリカバリ方式の提案
林匡哉; 堀田真貴; 吉永努; 大津金光; 馬場敬信
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '99
発表日 1999年 - システムオンチップ化ノードで構成する並列計算機の性能評価
古川文人; 大津金光; 吉永努; 馬場敬信
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '99
発表日 1999年 - 受信メッセージ予測法の実装と評価
岩本善行; 大津金光; 吉永努; 馬場敬信
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '99
発表日 1999年 - MIMD並列計算機における仮想時間を用いた性能評価法
岩本善行; 阿部大輝; 大津金光; 吉永努; 馬場敬信
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '98
発表日 1998年 - 適応ルータのコストパフォーマンス
吉永努; 山口喜教
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '98
発表日 1998年 - トポロジ独立なA-NETマルチコンピュータの通信性能
澤田東; 阿部大輝; 廣田守; 吉永努; 馬場敬信
口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '97
発表日 1997年
担当経験のある科目_授業
共同研究・競争的資金等の研究課題
- 通信量削減とQoS向上のための通信負荷に適応するD2D分散協調キャッシュの開発
日本学術振興会, 科学研究費, 基盤研究(C)(一般), 研究代表者
研究期間 2024年04月 - 2027年03月 - 通信量削減と低遅延応答のための分散協調キャッシュサーバアーキテクチャに関する研究
吉永 努
日本学術振興会, 科学研究費助成事業 基盤研究(C), 電気通信大学, 基盤研究(C), 研究代表者, 2021年度は,ネットワークの動画配信サービスを対象として,以下の研究を実施した. 1.高負荷時にも配信サービスが停止しにくいキャッシュサーバの設計 ユーザからのリクエスト量の時間変化分を予測し,高負荷時には配信する動画の画質を自動的に低下させる方式を採用する.動画のキャッシュサーバは,通信負荷に合わせてより重要なデータのヒット率が向上するように,画質毎の優先度付きキャッシュ制御を行う.提案方式を組み込んだコンテンツ配信ネットワーク(CDN)シミュレータを作成し,優先度付きキャッシュ制御方式の有効性を考察した.実験の結果,優先度付きキャッシュは従来方式のユーザQoEを改善できることを確認した.また,モバイルデバイスで構成する分散協調キャッシュとの併用についても検討した. 2.FPGA搭載型キャッシュサーバの設計 動画配信ネットワーク用のキャッシュサーバにFPGAボードを搭載し,FPGAに実装する専用ハードウェアによってネットワークの通信プロトコル処理,コンテンツ検索,メモリ(DRAM)やストレージ・アクセスを実行する.FPGA実装の目的は,キャッシュ制御処理の低遅延化,低消費電力化である.2021年度は,FPGAに実装するキャッシュ制御ハードウェアを試作し,まず単発のユーザリクエストを処理する実験を行った.予備実験の結果,FPGAを用いたキャッシュ制御のハードウェア化によって,ユーザリクエスト処理の低遅延化が実現できる見通しを得た., 21K11805
研究期間 2021年04月 - 2024年03月 - 数理モデルと機械学習の統合的手法による次世代無線システムの高信頼実時間制御
計 宇生; 金子 めぐみ; 村瀬 勉; 吉永 努; 策力 木格; 江 易翰
日本学術振興会, 科学研究費助成事業 基盤研究(A), 国立情報学研究所, 基盤研究(A), 研究分担者, 2020年度では、以下の項目に関する研究を実施した。 1)数理モデルと機械学習の統合手法による無線資源割当については、数理モデルの助けを借りて、効果的に学習する方法について検討した。通信と計算資源の割当問題を非線形計画問題として数理モデル化し、モデルのパラメータ化と非制約化転換で、目的と制約の双対関係を利用して、Deep Dual Learningの手法を使った学習を行った。数理モデルによる近似よりも高いシステム性能が得られたことを確認した。また、深層畳込みニューラルネットワークに基づく転移学習を利用して、異なる無線環境にも適用できる周波数検知方法を提案した。 2)コンテクストアウェアな通信とオフローティングについては、自動運転・協調ロボットなどの迅速な判断を行うべき場合において、近隣の最新状況を素早く把握し、端末間で協調分散処理の実現方法について検討を行った。周囲の状況が動的に変化する環境において、強化学習を利用して、車両間の通信経路を先制的に確保する方法を検討した。状況の変化によって、経路を機動的に変えられるようにした結果、既存の手法よりも優れた性能が得られた。また、動的に干渉が存在する環境下におけるミッションクリティカルな車載通信のための品質制御方法について提案した。 3)FPGAを用いた通信処理、AI処理、キャッシングの高速化については、低遅延、高信頼の実時間処理を行うための加速処理をFPGAによって実現する方法として、分散協調キャッシュサーバ処理のFPGAオフロードについて検討を行った。ビックデータ解析のためにストレージとネットワークを密に結合させたFPGAを複数組み合わせたInterconnected-FPGAsと呼ばれるシステムが処理の加速化に有効であり、それを用いて分散協調キャッシュサーバの処理の一部をオフロードすることで、レスポンス時間が短縮されることを確認した。, 20H00592
研究期間 2020年04月 - 2024年03月 - 分散協調キャッシュを用いたコンテンツ配信ネットワークの通信量削減
吉永 努
日本学術振興会, 科学研究費助成事業 基盤研究(C), 電気通信大学, 基盤研究(C), 本研究では色タグ方式の分散協調キャッシュ制御手法を提案する。色タグ方式の分散協調キャッシュは、キャッシュサーバとコンテンツにそれぞれ色タグを付して制御する。 また、デバイス間通信を利用したコンテンツ配信機構としてTEA方式を提案する。TEA方式では、基地局通信範囲内及びD2D通信範囲内のモバイル端末数とコンテンツアクセスの偏り(Zipf則の偏り)パラメータを用いて基地局通信量を最小化する。 本研究の成果を活用して分散協調キャッシュ技術を用いたコンテンツ配信網プロトタイプを試作し、小規模な実証実験を行った。実験の結果、キャッシュなしに比べ最大92%の通信量削減効果が得られた。, 18K11259
研究期間 2018年04月 - 2021年03月 - 分散配置キャッシュ利用によるインターネット通信データ量削減の検証
TIS株式会社, 研究助成
研究期間 2016年07月01日 - 2019年03月31日 - FPGAを用いたデータ処理アクセラレータに関する研究
株式会社アバールデータ, 研究助成
研究期間 2017年02月01日 - 2018年01月31日 - 専用ハードウェアを用いたデータストリーム管理システムの開発
吉永 努
半導体理工学研究センター, アイデア・スカウト(IS) プログラム, 研究代表者, 高速・低電力なストリームデータ処理用ハードウェアを開発し,グリーンコンピューティング技術に貢献する.
研究期間 2014年04月 - 2017年03月 - コンテンツ分割キャッシュを用いた配信ネットワークの効率化
吉永 努
電気通信普及財団, 研究助成, 研究代表者, 本研究調査では,動画コンテンツ配信ネットワークの高速化について考察すると共に,動画を分割したコンテンツピース単位でWebキャッシュを制御する手法,及び効率的な配信経路選択手法について提案,評価する.
研究期間 2015年04月01日 - 2016年03月31日 - 並列問題の通信特性を有効活用する光ネットワークオンチップの網構成と通信方式
吉永 努; 三好 健文
日本学術振興会, 科学研究費助成事業, 電気通信大学, 基盤研究(C), 次世代メニーコアプロセッサのための光ネットワークオンチップ(NoC)として,静的及び動的波長割り当てを併用する網構成と通信方式を提案,評価した.提案するNoCは,細粒度メッセージを静的波長割り当てによって,また粗粒度メッセージを動的波長割り当てによって通信することに特徴を有する.実験の結果,提案するNoCは先行研究で提案した電気-光ハイブリッドNoCと比べて,電力当りの通信性能を向上させることを確認した., 22500042
研究期間 2010年 - 2012年 - 動的通信予測を用いた高性能・高信頼ネットワークに関する研究
吉永 努
日本学術振興会, 科学研究費助成事業, 電気通信大学, 基盤研究(C), ネットワークを流れる通信パケットの経路をルータで予測することで高性能通信を実現する方式を提案し,ルータのハードウェア設計とシミュレーションによる評価を行った.また,ネットワークトポロジーとアプリケーションの持つ通信パターンに対する予測アルゴリズムの関係を明らかにした.予測精度は通信環境に影響を受けるが,適切な予測アルゴリズムを用いることで予測ルータが種々のネットワーク環境において低遅延通信に有効であることを実験的に確認した., 19500040
研究期間 2007年 - 2009年 - 情報理論的予測に基づく計算機システムの投機処理に関する研究
韓 太舜; 森田 啓義; 長岡 浩司; 西新 幹彦; 吉永 努; 吉瀬 謙二
日本学術振興会, 科学研究費助成事業, 電気通信大学, 基盤研究(B), 本研究では、情報理論分野でこれまでに培われてきた様々なユニバーサルデータ予測手法を系統立てて検討し、計算機システムにおける投機処理への応用に取り組んだ。研究体制としては、情報理論と計算機アーキテクチャの二つの研究グループが共同して、計算機システムにおける投機処理に適したデータ構造の実現とそれに基づく投機実行アーキテクチャの設計、ならびに性能評価までを実施した。本研究の主な成果は以下の通りである。 1.投機処理に適したデータ構造としての反辞書 データ系列に出現しない極小系列の集合を利用した反辞書と呼ばれる圧縮法について考察した。従来、系列の長さの二乗のオーダの時間が必要であった反辞書の構成方法を線形オーダで可能にする算法を構築できた。その結果、漸近最適性をもつSPM法が入力長の二乗のオーダの計算時間を要するのに対し、線形の計算時間で同等の予測性能を達成し、本算法の有効性を確認した。 2.マイクロプロセッサ内部における分岐予測 分岐履歴と命令アドレスのパターンマッチングを用いた分岐予測法を提案し、予測精度の検証を行った。実験の結果、計算量や記憶量の制限がなければ、分岐履歴のみを用いた分岐予測法よりも高い予測精度が達成される可能性を示した。 3.予測スイッチングルータ 効率的に動作する予測スイッチングルータを実現するため、予測ミスパケットを削減する手法や予測ミスパケットを検出、破棄するための実装技術を提案した。また、それらを組み込み、動的な通信衝突などまで考慮した予測スイッチングの効果についてシミュレーションによる評価を行った。その結果、通信の規則性が強い通信パターンほど動的な通信予測スイッチングの効果が大きく、ゼロ負荷遅延のみならず、ネットワークの飽和スループットも改善することを確認した。, 17360178
研究期間 2005年 - 2006年 - 受信メッセージ予測に基づく高性能マルチコンピュータの研究
馬場 敬信; 横田 隆史; 大津 金光; 吉永 努; 加藤 茂夫; 長谷川 まどか
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 基盤研究(B), 本基盤研究は、並列処理計算機におけるもっとも基本的な処理であるメッセージ転送の高速化を目指すものである。その着想は極めて簡明なもので、「過去のメッセージの受信履歴をもとに、次に来るであろうメッセージを予測し、予測したメッセージに対する受信処理を投機的に行う」、というものである。 この着想を具体化するために、受信するメッセージの規則性を調べることから出発し、履歴をもとに次に受信するメッセージを予測するアルゴリズムを考案した。さらにこのアルゴリズムを広く使用されるメッセージ通信ライブラリMPIに実装し、提案手法の有効性をNAS Parallel Benchmarkを用いて、定量的に明らかにした。 これらの研究経過および成果は、具体的に次のように要約することができる。 1)メッセージの受信系列には規則性があることの実験的な裏付けを明らかにした。 2)予測アルゴリズムとしては、最後に受信したメッセージと同じもの(Previous)と、受信系列を利用したマルコフ予測(Markov)の2つの方法の有効性が高いことを実験的に示した。 3)予測アルゴリズムを静的に選択して使用する方法と、動的に適したものに切り替えて使用する方法とを考案した。 4)手法の有効性を検証するために、メッセージ通信を標準的なMPIライブラリを使用したNAS Parallel Becnmarkを使用して評価した。 5)評価の結果、我々の提案する手法が特定の計算機に依存せずに使用可能なこと、ソフトウェアライブラリ中への実装によって最大6.8%の性能向上が達成可能なこと、この手法の適用によって各ノードプロセッサのアイドル時間が有効活用できること、プロファイリングの結果を活用することで予測の成功率を向上し、予測ミスによるオーバヘッドを削減できること、などを明らかにした。 以上の成果をもとに、さらに受信メッセージ予測機構を動的な最適化機構の一環として捉え、予測と投機実行を基盤とする計算機システムの提案を行った。 これらの成果は、添付した学協会誌論文、国際会議論文、口頭発表、著書により公表するとともに、特許申請(国内と米国各1件)を行っている。, 14380135
研究期間 2002年 - 2005年 - 投機的受信処理によるメッセージ転送の高速化
馬場 敬信; 吉永 努; 大津 金光; 横田 隆史
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 基盤研究(C), 平成12〜13年度の研究成果を以下に要約する。 (1)汎用プラットフォーム上でのメッセージ系列の取得・分析 汎用的な環境における評価として、Message Passing Interface(MPI)ライブラリを使用して記述されたNAS Parallel Benchmark(NPB)プログラムを用い、そのメッセージ発生系列やメッセージ内容を詳細に分析した。それらの結果から、MPI関数の発生系列や、その内容について、規則性がみられることを明らかにした。さらに、MPIライブラリを変更することによって、メッセージ受信関数における受信処理の中断時から、実際にメッセージが到着するまでの「アイドル時間」を実測した。 (2)予測アルゴリズムの設計・開発 (1)の結果を基に、我々がこれまでに提案している「受信メッセージ予測法」に対するメッセージの予測アルゴリズムを提案した。具体的には、直前予測アルゴリズム、マルコフ連鎖アルゴリズム、および線形予測アルゴリズムとその誤差を用いたメッセージ予測アルゴリズムが挙げられる。一方、(1)で計測したアイドル時間の長さの系列を基に、アイドル時間の長さを予測し、予測アルゴリズムをそのアイドル時間長に応じて変更させるための手法を提案し、予備評価を行った。 (3)予測アルゴリズムの実装 (2)で挙げた各予測アルゴリズムを、WSクラスタおよびSun Enterprise3500上のMPIライブラリに対して実装し、その予測成功率や速度向上率などの初期評価を行った。 (4)実装した予測アルゴリズムを用いた評価 予測アルゴリズムを実装した後、NAS Parallel Benchmark(NPB)プログラムを用いた性能評価を行った。この結果、最大で6.8%の性能向上を達成できることが判明し、本提案手法の有効性を確認した。 また、MPIライブラリに対して「動的予測アルゴリズム切り替え手法」及び「実行プロファイルに基づく静的な予測アルゴリズム選択手法」を導入した効果について実験的に明らかにした。, 12680328
研究期間 2000年 - 2001年 - 通信スケジューリングを考慮した適応ルーティングに関する研究
吉永 努
日本学術振興会, 科学研究費助成事業, 奨励研究(A), 研究代表者, 本研究では、新しい適応ルーティング・アルゴリズムとしてRecover-xを提案し、それを実現するルータチップの設計と評価を行った。 ・Recover-x適応ルーティングの提案 これまでのデッドロック回復方法を見直し、より少ないハードウェア量で実現可能なRecover-x適応ルーティングを提案した。具体的には、2次元トーラスネットワークにおいて、デッドロック対象とするメッセージを1次元のみに限定することで、ロジックの簡単化と高速動作を促進する。 ・HDLによるルータの記述と動作検証 Recover-x適応ルータをハードウェア記述言語Verilog-HDLにより設計した。また、LSI設計ツールを利用してシミュレーションによる動作検証と論理合成によるハードウェアコストの評価を行った。 ・通信性能の評価 Verilog-HDLのシミュレータを利用し、10×10(100ノード)の2次元トーラスネットワークに対するバンド幅と通信遅延(レイテンシ)時間を評価した。その結果、Recover-xは、通信パターンにかかわらず高バンド幅/低レイテンシであることを確認した。 以上のことから、Recover-xは従来の適応ルーティングに比べて高速動作設計に適合するアルゴリズムであり、堅牢な通信性能を示すことがわかった。, 11780190
研究期間 1999年 - 2000年 - システムオンチップアーキテクチャによるA-NETマルチコンピュータの研究開発
馬場 敬信; 加藤 茂夫; 大津 金光; 吉永 努; 福永 泰; 木村 康則; 中田 登志之; 山口 亨
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 基盤研究(B), 研究成果としては、A-NETの核言語であるA-NETLの処理系を各種プラネットフォーム上に実装評価することを継続的に行なうとともに、以下の観点から新たな研究開発を行なった。 (1)投機的マルチスレッド処理を行なうプロセッサ 将来の汎用マイクロプロセッサアーキテクチャとして最も有望と考えられているマルチスッド処理方式のうち、特にプログラムの制御フローに沿った複数パス投機処理を行なうものに関して、単純なベンチマークプログラムを用いてのシミュレーション評価を継続して行なった。 (2)各プロセッサ間を接続するネットワークルータ 接続形態が2Dメッシュおよびトーラス型のネットワークにおいて部分的に適応制御を行なうデッドロック回復可能なルータをハードウェア記述言語で記述し、論理合成を行なった結果を用いたシミュレーションによるコストパフォーアンスの評価を継続して行なった。さらに、論理合成結果から得られるタイミングパラメータを反映したソフトウェア機能シミュレーションを併用することにより、ベンチマークプログラムを用いた評価を行なった。 (3)システムオンチップ技術を用いた並列計算機システム システムオンチップ化技術の発展に伴い、将来の並列計算機のノードプロセッサはシステムオンチップ化されていくものと考えられる。その際、並列計算機システム全体としての性能が最大になるノードプロセッサの構成に関する評価が必要となる。本年度は、1チップ上に集積可能なトランジスタをプロセッサコア、キャッシュ用SRAM、オンチップ主記憶DRAMのそれぞれへの割り当て率を変化させた場合の全体としての性能の変化を、シミュレーションにより初期的評価を行なった。 (4)並列計算機の実用的な課題への応用 設計した並列計算機を、静的タイミング解析の並列処理、オブジェクト指向データベースに対する並列ナビゲーション、マルチエージェントシステム、ITS等の実際的な課題に応用し、その有効性を確認した。, 10558039
研究期間 1998年 - 2000年 - 並列オブジェクト指向計算機の性能評価に関する研究
吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 奨励研究(A), 本研究では、まず我々の研究室で開発した16ノードからなるA-NETマルチコンピュータを利用して、並列計算機の通信方式を詳細に評価した。次に、新たな通信方式をハードウェアとソフトウェアの両面で提案し、実験を行った。 1. 新しい適応ルータの提案と評価 A-NETマルチコンピュータは、適応ルーティングをサポートしている。しかし、アプリケーションの通信パターンによっては、その利点を十分に活かせない場合があった。そこで、メッセージ毎に出力チャネル選択の優先順位を指定できるようにした新たなルーティング手法を提案し、実際にルータを設計してその有効性を評価した。 2. 受信メッセージ予測によるプログラムの先行実行 並列オブジェクト指向プログラムの実行モデルであるメッセージ駆動方式の改善について検討した。そして、直後(将来)に到着するであろうメッセージを予測して、メッセージ受信後の処理を投機的に先行実行する方式を提案し、A-NETマルチコンピュータに実装した。その予備評価により、アプリケーションの通信パターンに適合した予測アルゴリズムを使用することにより、高い確率で到着メッセージの予測が可能であることを示した。 今後は、上記2点に関し、さらに詳細な実験を行う。具体的には、ハードウェア記述言語を利用したルータの設計とシミュレータを用いた大規模シミュレーションによる評価、実用的アプリケーションに対する受信メッセージ予測法の効果などを明らかにする。, 09780237
研究期間 1997年 - 1998年 - 型推論による並列オブジェクト指向言語実行の高速化
馬場 敬信; 大津 金光; 吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 基盤研究(C), 本年度は、並列オブジェクト指向言語A-NETLの商用並列計算機、ワークステーションクラスタ、専用並列計算機、NTクラスタへの実装を継続的に行なうとともに、その性能評価結果をもとに、実行性能を向上するための方式を検討した。また、この性能向上の一環として、型推論について検討した。 1. A-NETLの適用並列計算機への実装とその性能評価 A-NETLを商用並列計算機AP1000に実装すると共に、その性能向上の可能性について検討を加えた。 2. A-NETLのワークステーションクラスタへの実装とその性能評価 A-NETLをワークステーションクラスタに実装すると共に、その性能向上の可能性について検討を加えた。また,型推論による性能向上の効果を具体的に明らかにした。 3. A-NETLの専用並列計算機への実装とその性能評価 本研究では、アーキテクチャの支援により型の問題に対応した場合の性能を明らかにしている。型推論は行なっていないが、動的にタグで対処した場合の性能を明らかにしている。 4. A-NETLのNlTクラスタへの実装とその性能評価 A-NETLをNTクラスタに実装することを前提に、そのためのメッセージパッシングレイヤについて、具体的に検討、実現した。, 09680324
研究期間 1997年 - 1998年 - 非決定的並列プログラム検証のための論理時間に基づく再演機構
馬場 敬信; 吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 基盤研究(C), 本年度行った研究の実績は次の通りである。 (1)イベント及び論理時間の定義とその検証 並列オブジェクト指向言語プログラムの実行において、メッセージの通信、各ノードプロセッサ上でのコンテクスト切り替えなど、処理の区切りとなるものをイベントとして定義し、イベント間の半順序関係をもとに論理時間を定義した。 (2)論理時間に基づく再演実行機構の設計 提案する方式の要点は、イベントを計測しながらテスト実行を行い、イベント記録をもとに、各イベントの論理時間を定めるとともに、再演時には論理時間によって再演実行の順序を決定するものである。 (3)デバッガの設計、試作 (1)、(2)に基づく並列プログラムデバッガを設計し、研究室で試作したマルチコンピュータ上に実現した。各ノードはイベントが発生するたびにこれを記録し、一定の時間間隔でホストに送信する。デバッガの試作に当たっては、各ノード上のファームウェアを活用して、できるだけプローブ効果を抑える工夫をした。 (4)実験による評価 実験によって、イベントに基づく論理時間の定義を基本とする記録、表示、再演のための機構の有効性が明らかになった。特に、使用者から見ると、非同期的な現象をあたかも同期的な現象のように扱えるため、極めてデバッグしやすくなる。また、デバッグ機能の付加に伴う動的な負荷は、イベント記録について、1イベント当り平均0.04ms、記憶容量において約35Bであり、リプレイの実行性能が1論理時間に対する表示に0.94sと十分実用に耐えるものであることを確かめた。 (5)成果報告 本研究の成果については、添付の研究発表に示すように、電子情報通信学会論文誌、及びSpringer社Lecture Notes in Computer Science1107などに掲載となった。また、関連する研究成果の報告を添付の文献リストに示すように行った。, 08680346
研究期間 1996年 - 1996年 - 並列オブジェクト指向言語の高並列計算機への高効率実装に関する研究
吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 奨励研究(A), 本研究では,並列オブジェクト指向言語の普及と実装技術の確立を目的として,我々の研究室で設計した言語A-NETLを商用の高並列計算機である富士通AP1000に実装し,通信性能やアプリケーションの処理効率などを評価した. 実装方式の確立 AP1000ばかりでなく,幅広いアーキテクチャへの移植性を考慮して,広く普及しているC言語へのトランスレート方式を採用した.ベンダ提供のCコンパイラを利用することで,アーキテクチャ固有の低レベル・ハードウェア気候を利用した最適化が低コストで可能になる.トランスレータは,ユーザプログラムを翻訳するばかりでなく,A-NETL-C言語間のセマンティックギャップを埋めるコードを自動生成する. 実装と改善 メッセージ通信性能をA-NETL及びCプログラムについて計測した所,当初の実装においては,A-NETLはCの約3.4倍のオーバヘッドを伴っていた.その後,メッセージ受信領域のプリアロケ-トや受信後のディスパッチ処理を改善することにより,2倍弱のオーバヘッドに抑えることができた. アプリケーション性能 Nクイーン,ガウスの消去法による連立方程式の解析,分子動力学シミュレーションなどの問題について実行時間を調べた所,順に10.3(24),5.7(24),14.8(25)倍の台数効果が確認できた(カッコ内はノード数). 今後の課題 A-NETLは,変数の型宣言がない,同期/非同期など種々のメッセージパタンがある,などの理由でC言語と比較すると実装のコストが大きい.今後,コンパイル時の変数型推論,Active Messageの導入などにより,さらなる効率化を図りたい., 07780225
研究期間 1995年 - 1995年 - 自律系並列オブジェクト指向計算モデルに関する研究
馬場 敬信; 吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 一般研究(C), 本年度行った研究の実績は次のとおりである。 (1)宣言型同期機構の定義とA-NETL言語への組み込み 複数メッセージの送受信、実行順序の指定、メソッド起動のロック、起動条件の指定などから成る宣言的な同期機構を定義し、これをA-NETL言語に組み込んだ。同時に設計した仕様に基づいて種々の非同期問題を記述することにより、定義の妥当性を検証した。 (2)コンパイラ、OSなどの処理系の試作 設計した言語の仕様に沿ってコンパイラを改訂した。 同期機構のための実行時処理については、ユーザコードとOSコードにそれぞれ適切と思われる機能分散を行った。基本的には、簡単な処理はユーザコードで、重たい処理はトラップ命令によりOSに制御を移して行う。 (3)実験による効果の測定 定義した同期機構を用いて、種々の並列問題を記述するとともに、これをA-NETマシンシミュレーション上でシミュレーションすることにより、同期機構の効果を実験的に明らかにした。この結果、本機構によってユーザは非同期的な事象をそのまま自然な形でモデル化できる。その効果はスケーラブルで6〜17才オブジェクトに対して平均で20.6%、65オブジェクトに対して平均46.1%の実行時間の削減になる、などが判明し、同期機構の有効性が実験的に明らかになった。 (4)成果の報告 本研究の成果については、添付の文献におけるJSPPで発表するとともに、電子情報通信学会英文論文誌(IEICE)に投稿、掲載となった。また、関連する研究成果の報告を添付の文献リストに示すように行った。, 07680334
研究期間 1995年 - 1995年 - 超並列オブジェクト指向ソフトウェアのための視覚的プログラミング環境の構築
吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 奨励研究(A), 本研究では,現在我々の研究室で開発中の並列オブジェクト指向トータルアーキテクチャA-NETをベースとして,グラフィカルなユーザインターフェイスを用いて並列プログラムの開発を支援し,またデバッグするための環境を構築した. 1.プログラミング支援システムAPSS ユーザは,専用のプログラミング支援システムAPSSから,ソースコードの編集,コンパイル,実行までを一貫して行える.また,オブジェクト間の通信関係を反映した静的な負荷分散を行なうために,プログラム構成ファイルの作成も支援する.プログラム構成ファイルにより,プログラムに属するオブジェクトやクラスなどを宣言し,それらの計算コストや通信関係を指定することができる. 2.デバッガ オブジェクト内のデバッグについては,ソースコードレベルのブレークポイント方式で対応する.一方,複数オブジェクト間にまたがる部分ついては,非決定性あるいはプローブ効果など並列処理固有の問題が生じる可能性があるため,テスト実行によるイベント記録とリプレイによって,イベント単位での処理の再現性を確保する. イベントには,オブジェクト間のインタラクションとしてのメッセージ交換と,並列計算機の各ノード内で発生するプロセス切替えがある,デバッガは,これらのイベントを記録編集して2次元ダイアグラムで関係を表示すると共に,リプレイ時には個々のオブジェクトの状態とメッセージ送受信の様子をアニメーション的にグラフィック表示する. 3.今後の課題 現在は上記のシステムが動作し始めた段階であり,具体的な評価はまだ行っていない.今後,A-NETLプログラミング熟練者,および初心者に本システムを使用してもらい,システムの有効性を検討する予定である., 06780233
研究期間 1994年 - 1994年 - 並列オブジェクト指向トータルアーキテクチャ[A-NET.]の開発
馬場 敬信; 前田 明; 小池 誠彦; 板東 忠秋; 米澤 明憲; 吉永 努; 坂東 忠秋; 熊谷 毅
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 試験研究(B), 本研究では、並列オブジェクト指向計算モデルを核として,プログラミング言語・マシン・応用の3者を総合的に見た,トータルアーキテクチャA-NET(Actors NETwork)の開発を行ってきた。本年度の研究成果は以下の通りである。 1.8ノード並列計算機の試作 5年度までに設計,試作した2ノード分のプロトタイプを使用して,ハードウェアの動作検証とファームウェアの実装を行い,これを8ノードに拡張した。また,20ノードまで収納可能な筺体を設計・試作し,この中に8ノードを実装した。さらに,ホスト計算機であるNEWSワークステーション上に専用のデバイスドライバとハードウェアデバッグ用のモニタプログラムを作成し,試作した並列計算機とVMEバスを介して結合した。 2.言語の改訂とプログラミング環境の整備 本研究で開発した並列オブジェクト指向言語A-NETLの改訂とデバッガ等の並列プログラミング環境の整備を行った。新たな言語仕様としては,A-NETLにファイルアクセス機能を追加した。また,オブジェクトの自律的動作を促進するための同期機構の実装法を改善し,評価した。A-NETL言語の処理系については,統合化されたプログラミング環境,コンパイラ,アロケータ,リンカ,シュミレータの動作の安定化と移植性の向上を図った。 デバッガについては,A-NETLのソースコードレベルのブレークポイント方式とリプレイ方式を併用したシステムを試作した。 3.今後の課題 当面の課題は,8ノード版ハードウェアの調整,16ノード版への拡張(このための基板と実装部品は準備済み),ならびにソフトウェア環境をシミュレータから実機へ移行することである。また,同時にA-NETLの使用できる環境をA-NETマルチコンピュータ以外に拡大するために,商用並列マシンAP-1000上でのA-NETL処理系の実現,ワークステーションクラスタ上へのメッセージ通信ライブラリを用いた実現などを進めていく予定である。, 04555077
研究期間 1992年 - 1994年 - 超並列計算機のためのトポロジ独立なメッセージルーティングに関する研究
吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 奨励研究(A), 超並列計算機のためのネットワークトポロジ独立なメッセージの通信方式を設計し、シミュレータを試作していくつかのサンプルプログラムについて実験を行った。以下に、具体的な通信方式と実験結果について報告する。 1.通信方式 ネットワークトポロジについては静的に可変な直接網を対象とし、ハイパーキュープ、2D、3Dメッシュ、トーラス、トリ-などについて経路選択可能なものを設計した。このため、メッセージの宛先はシリアルなノード番号で表し、各ノードのル-タに持たせた宛先ノード番号に対する出力ポート番号のテーブル参照によって経路選択を行う。また、ネットワーク資源を有効利用できるよう適応型ルーティングをサポートし、衝突が発生した場合には最短経路の中から異なる経路を選択することができる。出力ポートがすべて使用可能でない場合、デッドロックを防ぐため、適当なパケットをル-タ内のバッファに退避してポートを開放するバーチャルカットスルー方式を実装した。 2.実験結果 LAN上の複数のUNIXワークステーションを用いてシミュレーション実験を行える環境を整備し、いくつかの具体的なサンプルプログラムの通信パターンについて実験を行った。なお、本シシュレータはノード内の処理もシシュレートしているため、時間的に正確な通信パターンをシシュレートすることができる。今回の実験では、ノード内部の処理能力として研究室で設計中のA-NET計算機の性能を仮定した。実験の結果、MIMD的に動作する問題については0.3msec程度の通信遅延時間で線形的な並列処理による速度向上を達成できることが分かった。また、SIMD的な問題では0.1msec以下の通信遅延を実現しないと良好な速度向上が期待できないことが分かった。, 05780226
研究期間 1993年 - 1993年 - 超並列処理のためのオブジェクト指向言語とその処理に関する研究
馬場 敬信; 吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 重点領域研究, 平成4年度に設計した並列オブジェクト指向言語の実行モデルを改善するとともに,言語処理系の試作とシミュレーション実験を行った。以下に,具体的な内容について整理する。 1.実行モデルの改善 (1)オブジェクトロードの高速化: ホストから各ノードへのオブジェクトの転送を高速化するため,クラスやインデックスト・オブジェクトのアドレスをすべてのノードで統一し,ブロードキャストすることとした。 (2)メソッド起動の高速化: メッセージを受信してからユーザメソッドを起動するまでの時間短縮を目的として,変数宛以外のメッセージセレクタを受信先オブジェクトのメッセージ辞書のアドレスとし,実行時のメソッド探索を不要にした。 2.並列プログラミングの支援 並列オブジェクト指向のプログラミングの支援を目的として,以下に述べる専用の環境を構築した。 (1)コンパイラ: 上に述べた実行モデルの改善を達成するための改訂を行った。具体的には,従来動的に決定していたオブジェクトのロードアドレスをコンパイル時に決定し,OSが行っていた実行モジュールの再配置を不要にした。 (2)統合プログラミング環境: 平成4年度から進めてきた専用プログラミング環境の開発を継続して行った。今年度は,プログラムの編集から実行までを統合的に行える環境を整備した。 3.今後の課題 言語処理系,OS,シミュレータの改訂がほぼ終了した。今後は,シミュレータを用いて性能評価を行う必要がある。また,より並列プログラムの開発が容易になるよう,イベント履歴に基づくプログラム実行のリプレイなどをサポートした並列デバッガを現在構築中である。, 05219203
研究期間 1993年 - 1993年 - 高並列オブジェクト指向計算機のためのオペレーティングシステムの研究
吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 奨励研究(A), 04750303
研究期間 1992年 - 1992年 - 超並列処理のためのオブジェクト指向言語とその理処に関する研究
馬場 敬信; 吉永 努
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 重点領域研究, 超並列処理をより実用的なものとすることを目的として,並列オブジェクト指向実行モデルを再検討し,その結果に基づいて記述言語を改訂した.また,言語処理系を試作し,シミュレーション実験を行った. 1実行性能の改善 (1)実行順序制御機構の導入:種々のシミュレーション問題などで必要となる時間的な情報の管理をグローバルな同期をとることなく行えるように,メッセージの到着順に関係なくメソッドの起動順序を柔軟に管理するための記述を,並列オブジェクト指向言語の言語仕様に加えた. (2)メソッド起動の高速化:OSのオーバヘッド軽減を目的として,実行順序制御やメッセージの待ち合わせなどについて,コンパイラによるスケジューリング解析を行い,通常メソッドのディスパッチを高速化した. 2並列プログラミングの支援 (1)アロケータ:分散メモリ型の並列計算機上で実行することを仮定して,オブジェクトを各ノードプロセッサに最適に割り付けるためのネットワークトポロジ独立なアロケータを試作した. (2)統合プログラミング環境:プログラムの編集からコンパイル,ネットワークトポロジとノード数の指定,アロケーション,実行などを統合的に行える専用のプログラミング環境を試作した. 3実験 LANにより結合されたUNLXワークステーション上にシミュレータを試作し,改善前との比較を行った.その結果,各プログラムの総通信量は40〜60%削減された.また,実行時間については,1〜3倍程度速度が向上した., 04235202
研究期間 1992年 - 1992年 - 事例ベ-ス型推論による電力回路網の構成制御方式に関する研究
奥田 健三; 吉永 努; 馬場 敬信; 山崎 勝弘
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 一般研究(C), 本研究では、知識工学的手法の研究、とくに事例ベ-ス形推論法の有効性を調べるために、電力系統における事故時復旧案作成の問題を取り上げた。すなわち、事例ベ-ス形推論における基本的な枠組みである、事例ベ-スの構築、事例の検索、評価、適合・修正、推論過程の説明等、各段階について広く検討を行い、これらの機能を復旧案作成支援システムに組み込んだ。 まず、対象とする電力系統の事故時復旧問題を明らかにしたのち、復旧支援の全体的なシステムの構成を、事例を精製するための一般的な復旧アルゴリズムを持った復旧案作成部と、事例ベ-ス形推論による復旧案作成部とからなるものとした。前者については、従来の研究で懸案事項であった、一般的な復旧アルゴリズムのなかで、とくに重要な負荷切替え能力の向上を図った。後者については、事例ベ-ス形推論において、事例の適切かつ効率的な検索法や検索した事例を現在与えられた問題に適合・修正する方法を重点的に検討した。さらに実規模大のモデル系統について、多数のケ-スのシミュレ-ションを実施し、詳細な評価を行った。また、このような支援システムにおいて不可欠な、マンマシンインタフェ-スの構築に留意し、ユ-ザにとって理解し易く、かつシステムの操作性の向上を図った。 その結果、事例ベ-スの構築法、事例の選定方針等について、当初我々が取った方針が適切であったことが確認されるとともに、具体的かつ有益なデ-タを得ることができた。 これらの成果は単に電力系統における事故時復旧案作成に適用できるばかりでなく、その手法は広く各分野に応用できるものと確信する。, 63550201
研究期間 1988年 - 1989年 - オブジェクト指向高度並列AIマシンに関する研究
馬場 敬信; 吉永 努; 熊谷 毅; 青木 恭太; 奥田 健三; 米澤 明憲; 山崎 勝弘
日本学術振興会, 科学研究費助成事業, 宇都宮大学, 一般研究(C), 一般に並列性は、問題領域によって量的にも質的にも異なるものであり、このためアーキテクチャに対する要求も応用分野によって変わってくる。従って、真に有効な高度並列計算機を実現するには、計算機のハードウェア構成と共に、応用分野や並列処理記述言語の検討を同時に進める必要がある。 このような背景から、本研究では、並列オブジェクト指向を核概念として、応用分野、並列プログラミング言語、ならびにこれを実行する高並列計算機アーキテクチャの3者を総合的な立場から考慮したトータルアーキテクチャA-NETを提案した。 この提案に基づいて、 (1)並列処理を前提とした並列オブジェクト指向言語A-NETLを定義し、その処理系を開発した。 (2)A-NETLを人工知能分野(知識工学、言語理解)ならびに要素プロセッサのOS記述に応用し、その評価を行った。 (3)A-NETLの高速実行のための専用プロセッサを設計し、そのシミュレーションによる評価を行った。 などの成果を得た。 これらの成果によって、我々は、高度並列計算機の実用化を目指した壮大なプロジェクトを実施する道が開かれたと確信しており、今後、プロトタイプマシンの試作を行うと共に、その結果を踏まえて、A-NET専用のVLSIチップの試作から高度並列計算機の試作へと進めて行きたいと念願している。, 62550255
研究期間 1987年 - 1988年
産業財産権
- ネットワークシステム、ノード装置、キャッシュ方法及びプログラム
特許権, 吉永努, 中島拓真, 森元敏雄, 石橋靖嗣, 特願2018-015767, 出願日: 2018年01月31日, TIS株式会社,電気通信大学, 特許第67281879, 発行日: 2020年06月23日 - ネットワークシステム,キャッシュ方法,キャッシュプログラム,管理装置,管理方法及び管理プログラム
特許権, 吉永努, 中島拓真, 吉見真聡, 森本敏雄, 村木暢哉, 特願2018-551597, PCT/JP2017/040485, 出願日: 2017年11月09日, TIS株式会社,国立大学法人 電気通信大学, WO2018/092679, 公開日: 2018年05月24日, 6712744, 発行日: 2020年06月04日 - ネットワークシステム、ノード装置、キャッシュ方法及びプログラム
特許権, 吉永努, 中島拓真, 森元敏雄, 石橋靖嗣, 特願2017-138406, 出願日: 2017年07月14日, TIS株式会社,電気通信大学, 特開2019-020994, 公開日: 2019年02月07日, 6638145, 発行日: 2020年01月07日, チャンク分割転送する動画の分散協調キャッシュ - ネットワークシステム,無線通信端末,通信方法及びプログラム
特許権, 吉永努, 城間隆行, 中島拓真, 森元敏雄, 石橋靖嗣, 特願2017-175164, 出願日: 2017年09月12日, TIS株式会社,国立大学法人 電気通信大学, 特開2019-53358(P2019-53358A), 公開日: 2019年04月04日, 6606808, 発行日: 2019年11月01日 - ネットワークシステム、ノード装置、キャッシュ方法及びプログラム
特許権, 吉永 努, 中島 拓真, 吉見 真聡, 森元 敏雄, 村木 暢哉, 特願2017-105055, 出願日: 2017年05月26日, TIS株式会社 , 国立大学法人電気通信大学, 特開2018-200581, 公開日: 2018年12月20日, 6592809, 発行日: 2019年10月04日, 階層ネットワークにおけるキャッシュ方法及びプログラム - 通信端末装置、通信ネットワークシステム、通信方法及び通信プログラム
特許権, 小木 真人, 入江 英嗣, 大木 裕太, 吉永 努, 特願2012-242584, 出願日: 2012年12月02日, 国立大学法人電気通信大学, 特開2014-092903, 公開日: 2014年05月19日, 特許第6061377号, 発行日: 2016年12月22日, 直観的に連携対象の機器を指定し、煩雑な通信確立手順を経ることなく、連携機器間の接続を確立することができる通信端末装置を提供することを目的とする。 - ネットワークシステム,キャッシュ方法及びキャッシュプログラム
特許権, 吉永努, 中島拓真, 吉見真聡, 森本敏雄, 村木暢哉, 特願2016-224243, 出願日: 2016年11月17日, TIS株式会社,電気通信大学 - データ処理装置およびデータ処理方法,並びにプログラム
特許権, オゲヤースィン, 吉見真聡, 入江英嗣, 吉永努, 特願2014-230387, 出願日: 2015年11月13日, 特開2016-095606, 公開日: 2016年05月26日 - 映像データ送出方法、並びに、その方法を実行する映像データ送出装置、その方法をコンピュータに実行させるための映像データ送出プログラム、およびそのプログラムが書き込まれた記録媒体
特許権, 吉永 努, 小山卓視, 坪田浩乃, 小野松丈洋, 錦織義久, 特願2008-168460, 出願日: 2008年06月27日, 国立大学法人電気通信大学(50%), 船井電機株式会社(50%), 特許第5257659号, 発行日: 2013年05月02日 - ルータおよび並列分散システム
特許権, 鯉渕道紘, 吉永努, 鎌倉正司郎, 特願2007-135940, 出願日: 2007年05月22日, 大学共同利用機関法人情報・システム研究機構, 国立大学法人電気通信大学, 特開2008-294586, 公開日: 2008年12月04日