吉永 努

情報・ネットワーク工学専攻教授
Ⅰ類(情報系)教授
メタネットワーキング研究センター教授

学位

  • 工学修士, 宇都宮大学
  • master of engineering, Utsunomiya univ.
  • 博士(工学), 宇都宮大学
  • doctor of engineering, Utsunomiya University

研究キーワード

  • 計算機システム
  • ネットワーク・コンピューティング
  • 並列分散処理
  • クラスタ・コンピューティング
  • ルーティング・アルゴリズム
  • リコンフィギャラブル・システム
  • 相互結合網

研究分野

  • 情報通信, 計算機システム

経歴

  • 2023年02月 - 現在
    電気通信大学, 大学院情報理工学研究科、情報・ネットワーク工学専攻, 教授
  • 2016年04月01日
    電気通信大学, 大学院情報理工学研究科, 教授
  • 2010年04月01日
    電気通信大学 大学院情報システム学研究科, 情報ネットワークシステム学専攻, 教授

学歴

  • 1988年03月
    宇都宮大学, 工学研究科, 情報工学専攻
  • 1986年03月
    宇都宮大学, 工学部, 情報工学科
  • 1979年04月 - 1982年03月
    群馬県立太田高校, 日本国

委員歴

  • 2017年06月 - 現在
    コンピュータシステム研究専門委員会 顧問, 電子情報通信学会, 学協会
  • 2017年03月 - 現在
    フェロー, 電子情報通信学会, 学協会
  • 2012年05月 - 現在
    シニア会員, 電子情報通信学会, 学協会
  • 2015年06月 - 2017年06月
    コンピュータシステム研究専門委員, 電子情報通信学会, 学協会
  • 2016年11月
    コンピュータ科学教育委員会委員, 情報処理学会, 学協会
  • 1999年 - 2016年05月
    論文誌査読委員, 電子情報通信学会, 学協会
  • 2013年05月 - 2015年05月
    コンピュータシステム研究会 委員長, 電子情報通信学会, 学協会
  • 2010年11月 - 2014年05月
    英文論文誌D 編集委員, 電子情報通信学会, 学協会
  • 2011年05月 - 2013年04月
    コンピュータシステム研究会 副委員長, 電子情報通信学会, 学協会
  • 2005年05月 - 2011年05月
    コンピュータシステム研究専門委員, 電子情報通信学会, 学協会
  • 2006年05月 - 2010年05月
    和文論文誌D編集委員, 電子情報通信学会, 学協会
  • 2006年06月 - 2009年05月
    シニア査読委員, 情報処理学会, 学協会
  • 2007年05月 - 2009年03月
    情報システム教育委員, 情報処理学会, 学協会
  • 2002年 - 2005年05月
    コンピュータシステム研究会 幹事, 電子情報通信学会, 学協会
  • 2001年 - 2005年
    論文誌編集委員, 情報処理学会, 学協会
  • 1995年 - 1997年
    計算機アーキテクチャ研究会連絡委員, 情報処理学会, 学協会

受賞

  • 2021年09月
    日本神経回路学会, この賞は,電子情報通信学会ニューロコンピューティング研究会で発表された全 論文のうち,特に優秀な論文に送られるもので,毎年3編程度選ばれるものです.
    優秀研究賞, 柳田悠介;佐藤俊治;策力木格;吉永努
    国内学会・会議・シンポジウム等の賞, 日本国
  • 2015年05月
    電子情報通信学会
    ISS活動功労賞

論文

  • Load-based Content Allocation Scheme for Realizing Efficient Mobile Cooperative Cache
    Taiki Akiba; Celimuge Wu; Tsutomu Yoshinaga
    ラスト(シニア)オーサー, International Journal of Networking and Computing, 13, 2, 93, 117, 2023年07月, 査読付
    研究論文(学術雑誌), 英語
  • Blockchain-Enabled Internet of Vehicles Applications
    Junting Gao; Chunrong Peng; Tsutomu Yoshinaga; Guorong Han; Siri Guleng; Celimuge Wu
    Electronics, MDPI AG, 12, 6, article 1335, 62 pages, 2023年03月11日, 10.3390/electronics12061335, Internet of Vehicles (IoV) is a network that connects vehicles and everything. IoV shares traffic data by connecting vehicles with the surrounding environment, which brings huge potential to people’s life. However, a large number of connections and data sharing will seriously consume vehicle resources during the interaction. In addition, how to build a safe and reliable connection to ensure vehicle safety is also an issue to consider. To solve the above problems, researchers introduce blockchains into IoV to build a safe and reliable vehicle network relying on the distributed account structure, immutable, transparent and security features of blockchains. We have investigated the application of blockchains in IoV in recent years, and have summarized and compared these studies according to their purposes. On this basis, we also point out the future trends and opportunities.
    研究論文(学術雑誌), 英語
  • Semantic segmentation-based semantic communication system for image transmission
    Jiale Wu; Celimuge Wu; Yangfei Lin; Tsutomu Yoshinaga; Lei Zhong; Xianfu Chen; Yusheng Ji
    Digital Communications and Networks, Elsevier BV, 11 pages, 2023年02月, 10.1016/j.dcan.2023.02.006
    研究論文(学術雑誌), 英語
  • Multi-Robot Systems and Cooperative Object Transport: Communications, Platforms, and Challenges
    Xing An; Celimuge Wu; Yangfei Lin; Min Lin; Tsutomu Yoshinaga; Yusheng Ji
    IEEE Open Journal of Computer Society, 4, 23, 36, 2023年01月, 査読付, 10.1109/OJCS.2023.3238324
    研究論文(学術雑誌), 英語
  • Load-Based Content Allocation for Mobile Cooperative Cache
    Taiki Akiba; Celimuge Wu; Tsutomu Yoshinaga
    Proc. of the 13th International Workshop on Advances in Networking and Computing (WANC2022), IEEE, 1, 5, 2022年11月22日, 査読付, 10.1109/CANDARW57323.2022.00038
    研究論文(国際会議プロシーディングス), 英語
  • A communication-efficient distributed machine learning scheme in vehicular network.
    Yalong Li; Celimuge Wu; Lei Zhong; Tsutomu Yoshinaga
    Proceedings of the Conference on Research in Adaptive and Convergent Systems (RACS22), 7 pages, 92, 98, 2022年10月, 査読付, 10.1145/3538641.3561494
    研究論文(国際会議プロシーディングス), 英語
  • On-device federated learning with fuzzy logic based client selection
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Lei Zhong; Yusheng Ji
    2022 International Conference on Research in Adaptive and Convergent Systems, 64, 70, 2022年10月, 査読付, 10.1145/3538641.3561490
    研究論文(国際会議プロシーディングス), 英語
  • Fuzzy Logic based Client Selection for Federated Learning in Vehicular Networks
    Narisu Cha; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Lei Zhong; Jing Ma; Fuqiang Liu; Yusheng Ji
    IEEE Open Journal of the Computer Society, IEEE, 3, 39, 50, 2022年03月31日, 査読付, 10.1109/OJCS.2022.3163620, In vehicular networks, the problem of choosing proper clients is particularly complex due to the heterogeneity of network users, including the differences in the data, computation capability, available throughput, and samples freshness. We design a fuzzy logic based client selection scheme to address this issue.
    研究論文(学術雑誌), 英語
  • Toward Efficient Blockchain for the Internet of Vehicles with Hierarchical Blockchain Resource Scheduling
    Liming Gao; Celimuge Wu; Zhaoyang Du; Tsutomu Yoshinaga; Lei Zhong; Fuqiang Liu; Yusheng Ji
    MDPI Electronics, MDPI, 11, 5, 1, 21, 2022年03月07日, 査読付, 10.3390/electronics11050832, In this paper, we propose a hierarchical resource scheduling scheme for blockchain-enabled IoV systems that improves the performance of the blockchain-enabled IoV system by efficiently allocating computational resources. The superiority of the proposed method is fully demonstrated by comparing it with existing baseline methods.
    研究論文(学術雑誌), 英語
  • A Failsoft Scheme for Mobile Live Streaming by Scalable Video Coding
    H. Okada; M. Yoshimi; C. Wu; T. Yoshinaga
    IEICE Transactions Information and Systems, IEICE, E104-D, 12, 2121, 2130, 2021年12月04日, 査読付, 10.1587/transinf.2021PAP0015
    研究論文(学術雑誌), 英語
  • A Reinforcement Learning based Edge Cloud Collaboration
    Hiroki Kobari; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao
    Proc. of 2021 International Conference on Information and Communication Technologies for Disaster Management (ICT-DM), IEEE, 4 pages, 26, 29, 2021年12月03日, 査読付, 10.1109/ICT-DM52643.2021.9664025
    研究論文(国際会議プロシーディングス), 英語
  • Deep Reinforcement Learning Based Mode Selection for Coexistence of D2D-U and Wi-Fi
    Ganggui Wang; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Rui Yin
    Proc. of 2021 International Conference on Information and Communication Technologies for Disaster Management (ICT-DM), IEEE, 6 pages, 9, 14, 2021年12月03日, 査読付, 10.1109/ICT-DM52643.2021.9664091
    研究論文(国際会議プロシーディングス), 英語
  • Resource Management for Blockchain-enabled Internet of Vehicles
    Liming Gao; Chunrong Peng; Qitu Hu; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Siri Guleng
    Proc. of 2021 International Conference on Information and Communication Technologies for Disaster Management (ICT-DM), IEEE, 7 pages, 164, 170, 2021年12月03日, 査読付, 10.1109/ICT-DM52643.2021.9664129
    研究論文(国際会議プロシーディングス), 英語
  • A Fuzzy Logic Controller for Greenhouse Temperature Regulation System Based on Edge Computing.
    Yue Ren; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao
    Mobile Networks and Management - 11th EAI International Conference(MONAMI), Springer, 18 pages, 316, 332, 2021年10月, 査読付, 10.1007/978-3-030-94763-7_24
    研究論文(国際会議プロシーディングス), 英語
  • UAV-Empowered Vehicular Networking Scheme for Federated Learning in Delay Tolerant Environments
    Zhaoyang Du; Ganggui Wang; Narisu Cha; Celimuge Wu; Tsutomu Yoshinaga; Rui Yin
    Proc. of The 24th ieee international conference on computational science and engineering (IEEE CSE 2021), IEEE, 9 pages, 79, 2021年10月, 査読付, 10.1109/CSE53436.2021.00020
    研究論文(国際会議プロシーディングス), 英語
  • Toward Agile Information and Communication Framework for the Post-COVID-19 Era
    Celimuge Wu; Chunrong Peng; Zhaoyang Du; Liming Gao; Tsutomu Yoshinaga; Yusheng Ji
    IEEE Open Journal of the Computer Society, IEEE, 2, 290, 299, 2021年08月, 査読付, 10.1109/OJCS.2021.3102045
    研究論文(学術雑誌), 英語
  • Integrating autonomous decentralized communication and edge computing for real-time control in IoT system
    Masaya Harada; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Yusheng Ji
    Proc. of The 7th Euro-China Conference on Intelligent Data Analysis and Applications (ECC-2021), 9 pages, 2021年05月, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • A Brief Review of Multipath TCP for Vehicular Networks
    Luomeng Chao; Celimuge Wu; Tsutomu Yoshinaga; Wugedele Bao; Yusheng Ji
    MDPI Open Access Journal Sensors, MDPI, 21, 8, 1, 34, 2021年04月15日, 査読付, 10.3390/s21082793, In this paper, we first conduct a brief survey of existing MPTCP studies and give a brief overview to multipath routing. Then we discuss the significance technical challenges in applying MPTCP for vehicular networks and point out future research directions.
    研究論文(学術雑誌), 英語
  • Multi-Channel Blockchain Scheme for Internet of Vehicles
    Liming Gao; Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Yusheng Ji
    IEEE Open Journal of the Computer Society, IEEE, 2, 192, 203, 2021年03月31日, 査読付, 10.1109/OJCS.2021.3070714
    研究論文(学術雑誌), 英語
  • Coexistence Analysis of D2D-Unlicensed and Wi-Fi Communications
    Ganggui Wang; Celimuge Wu; Tsutomu Yoshinaga; Rui Yin; Tutomu Murase; Kok-Lim Alvin Yau; Wugedele Bao; Yusheng Ji
    Wireless Communications and Mobile Computing Journal, Hindawi, 2021, Article ID 5523273, 1, 11, 2021年03月25日, 査読付, 10.1155/2021/5523273
    研究論文(学術雑誌), 英語
  • Virtual Edge: Exploring Computation Offloading in Collaborative Vehicular Edge Computing
    Narisu Cha; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Kok-Lim Alvin Yau
    IEEE Access, IEEE, 9, 37739, 37751, 2021年03月02日, 査読付, 10.1109/ACCESS.2021.3063246, We design a virtual edge formation algorithm that considers both the stability of virtual edge and the computational resources available at the vehicles constituting the virtual edge.
    研究論文(学術雑誌), 英語
  • A Peak-Avoidance Scheme for Chasing Playback of Mobile Live Streaming
    Hiroki Okada; Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
    Proc. of the 2020 Eighth International Symposium on Computing and Networking Workshops (CANDARW), IEEE, 474, 476, 2021年02月22日, 査読付, 10.1109/CANDARW51189.2020.00098, In this study, we propose a mechanism called Adaptive Failsoft Control to avoid peak traffic in mobile live streaming with a chasing playback function.
    研究論文(国際会議プロシーディングス), 英語
  • A Routing Protocol for UAV-assisted Vehicular Delay Tolerant Networks
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Wang Xiaoyan; Kok-Lim Alvin Yau; Yusheng Ji
    IEEE Open Journal of the Computer Society, 1, 45, 61, 2021年01月28日, 査読付, 10.1109/OJCS.2021.3054759
    研究論文(学術雑誌), 英語
  • Virtual Edge: Collaborative Computation Offloading in VANETs
    Narisu Cha; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Proc. of the 10th EAI International Conference on Mobile Networks and Management (MONAMI 2020), (LNICST,volume 338), Springer Nature Switzerland AG 2020., 79, 93, 2020年12月22日, 査読付, 10.1007/978-3-030-64002-6_6, In this paper, we propose a virtual edge scheme where a node can offload its tasks to a virtual edge node that consists of multiple vehicles in vicinity.
    研究論文(国際会議プロシーディングス), 英語
  • UAV-empowered Protocol for empowered Protocol for Information Sharing in VDTN
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
    Proc. of The 16th International Conference on Mobility, Sensing and Networking (MSN 2020), IEEE, 626, 627, 2020年12月17日, 査読付, 10.1109/MSN50589.2020.00103
    研究論文(国際会議プロシーディングス), 英語
  • Context-Aware Clustering for SDN Enabled Network
    Ran Duo; Celimuge Wu; Yoshinaga Tsutomu; Yusheng Ji
    AIMCOM2 Workshop at the 28th IEEE International Conference on Network Protocols (ICNP 2020), 2020年10月, 査読付, 10.1109/icnp49622.2020.9259403
    研究論文(国際会議プロシーディングス)
  • Vehicle Speed Prediction with Convolutional Neural Networks for ITS
    Yifei Li; Celimuge Wu; Tsutomu Yoshinaga
    Proc. of the 2020 IEEE/CIC International Conference on Communications in China (ICCC Workshops), IEEE, 41, 46, 2020年08月09日, 査読付, 10.1109/ICCCWorkshops49972.2020.9209912, In this paper, we propose a convolutional neural network-based approach for a better estimation of vehicle traffics.
    研究論文(国際会議プロシーディングス), 英語
  • Collaborative Learning of Communication Routes in Edge-enabled Multi-access Vehicular Environment
    Celimuge Wu; Zhi Liu; Fuqiang Liu; Tsutomu Yoshinaga; Yusheng Ji; Jie Li
    IEEE Transactions on Cognitive Communications and Networking, IEEE, 4, 4, 1155, 1165, 2020年06月15日, 査読付, 10.1109/TCCN.2020.3002253, In this paper, we propose a collaborative learning-based routing scheme for multi-access vehicular edge computing environment.
    研究論文(学術雑誌), 英語
  • Federated Learning for Vehicular Internet of Things: Recent Advances and Open Issues
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Kok-Lim Alvin Yau; Yusheng Ji; Jie Li
    IEEE Open Journal of the Computer Society, IEEE, Early Access, 2020年05月06日, 査読付, 10.1109/OJCS.2020.2992630, In this paper, we first conduct a brief survey of existing studies on FL and its use in wireless IoT. Then we discuss the significance and technical challenges of applying FL in vehicular IoT, and point out future research directions.
    研究論文(学術雑誌), 英語
  • Federated Learning for Vehicular Internet of Things: Recent Advances and Open Issues
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Kok-Lim Alvin Yau; Yusheng Ji; Jie Li
    IEEE Open Journal of the Computer Society, IEEE, 1, 61, 45, 61, 2020年05月06日, 査読付, 10.1109/OJCS.2020.2992630, In this paper, we first conduct a brief survey of existing studies on FL and its use in wireless IoT. Then, we discuss the significance and technical challenges of applying FL in vehicular IoT, and point out future research directions.
    研究論文(学術雑誌), 英語
  • SDN-based Handover Scheme in Cellular/IEEE 802.11p Hybrid Vehicular Networks
    Ran Duo; Celimuge Wu; Tsutomu Yoshinaga; Jiefang Zhang; Yusheng Ji
    MDPI Open Access Journal Sensors, MDPI, 20, 4, 1, 17, 2020年02月17日, 査読付, 10.3390/s20041082
    研究論文(学術雑誌), 英語
  • A VDTN scheme with enhanced buffer management
    Zhaoyang Du; Celimuge Wu; Xianfu Chen; Xiaoyan Wang; Tsutomu Yoshinaga; Yusheng Ji
    Wireless Networks, Springer Nature, 26, 1537, 1548, 2020年01月05日, 査読付, 10.1007/s11276-019-02241-x
    研究論文(学術雑誌), 英語
  • Traffic Big Data Assisted Broadcast in Vehicular Networks
    Siri Guleng; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Proceedings of the Conference on Research in Adaptive and Convergent Systems (RACS'19), ACM, 236, 240, 2019年09月24日, 査読付, 10.1145/3338840.3355683, In this paper, we propose a traffic big data assisted broadcast scheme in VANETs.
    研究論文(国際会議プロシーディングス), 英語
  • Traffic Flow Prediction with Compact Neural Networks
    Yuhang Li; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Int. Conf. on Cloud and Big Data Computing (CBDCom), IEEE, 5 pages, 1072, 1076, 2019年08月, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Integrating Licensed and Unlicensed Spectrum in Internet-of-Vehicles with Mobile Edge Computing
    Celimuge Wu; Xianfu Chen; Tsutomu Yoshinaga; Yusheng Ji; Yan Zhang
    IEEE Network Magazine, IEEE, 33, 4, 48, 53, 2019年07月31日, 査読付, 10.1109/MNET.2019.1800453, In this article, we propose a context-aware communication approach to efficiently integrate different licensed and unlicensed spectrums leveraging the edge computing technologies.
    研究論文(学術雑誌), 英語
  • Performance Evaluation of RPL-Based Sensor Data Collection in Challenging IoT Environment
    Liming Gao; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Lecture Notes in Electrical Engineering, 536, Springer Nature Singapore Pte Ltd., 275, 285, 2019年05月, 査読付, 10.1007 /978-981-13-6837-0_20
    研究論文(国際会議プロシーディングス), 英語
  • Decentralized Trust Evaluation in Vehicular Internet of Things
    Siri Guleng; Celimuge Wu; Xianfu Chen; Xiaoyan Wang; Tsutomu Yoshinaga; Yusheng Ji
    IEEE Access, IEEE, 2019, 7, 15980, 15988, 2019年02月, 査読付, 10.1109/ACCESS.2019.2893262
    研究論文(学術雑誌), 英語
  • Computational Intelligence Inspired Data Delivery for Vehicle-to-roadside Communications
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Yan Zhang
    IEEE Transactions on Vehicular Technology, IEEE, 67, 12, 12038, 12048, 2018年12月, 査読付, 10.1109/TVT.2018.2871606
    研究論文(学術雑誌), 英語
  • A Color-Based Cooperative Caching Strategy for Time-Shifted Live Video Streaming
    Hiroki Okada; Takayuki Shiroma; Celimuge Wu; Tsutomu Yoshinaga
    Proc. of the 6th International Symposium on Computer Systems and Architectures (CSA'18), 6 pages, 2018年11月29日, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • The template-based sub-optimal content distribution for a D2D content sharing network
    Takayuki Shiroma; Celimuge Wu; Tsutomu Yoshinaga
    Proc. of the 6th International Symposium on Computing and Networking (CANDAR 2018), IEEE, 6 pages, 2018年11月28日, 査読付, 10.1109/CANDAR.2018.00030
    研究論文(国際会議プロシーディングス), 英語
  • System Performance Assessment and Sizing for Cloud-based Data Backup
    Y. Taguchi; T. Yoshinaga
    Journal of Information Processing (ACS), IPSJ, 11, 2, 1, 10, 2018年11月, 査読付
    研究論文(学術雑誌), 英語
  • SDN-based Handover Approach in IEEE 802.11p and LTE hybrid vehicular networks
    Ran Duo; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Proc. of The IEEE International Conference on Cloud and Big Data Computing (CBDCom 2018), IEEE, 6 pages, 2018年10月10日, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • A Prophet-based DTN protocol for VANETs
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Proc. of The IEEE International Conference on Cloud and Big Data Computing (CBDCom 2018), IEEE, 4 pages, 1876, 1879, 2018年10月10日, 査読付, 10.1109/SmartWorld.2018.00315
    研究論文(国際会議プロシーディングス), 英語
  • Spatial Intelligence toward Trustworthy Vehicular IoT
    Celimuge Wu; Zhi Liu; Di Zhang; Tsutomu Yoshinaga; Yusheng Ji
    IEEE Communications Magazine, IEEE, 56, 10, 22, 27, 2018年10月, 査読付, 10.1109/MCOM.2018.1800089
    研究論文(学術雑誌), 英語
  • System Resource Management to Control the Risk of Data-Loss in Cloud-based Disaster Recovery
    Yuichi Taguchi; Tsutomu Yoshinaga
    Proc. of The 6th IEEE International Workshop on Architecture, Design, Deployment and Management of Networks and Applications (ADMNET), IEEE, 210, 215, 2018年07月23日, 査読付, 10.1109/COMPSAC.2018.10231, A method for system resource management of a cloud-based disaster recovery is proposed.
    研究論文(国際会議プロシーディングス), 英語
  • A context-aware edge-based VANET communication scheme for ITS
    Chang An; Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Yusheng Ji
    Sensors (Switzerland), MDPI AG, 18, 7, 1, 15, 2018年07月01日, 査読付, 10.3390/s18072022, We propose a context-aware edge-based packet forwarding scheme for vehicular networks. The proposed scheme employs a fuzzy logic-based edge node selection protocol to find the best edge nodes in a decentralized manner, which can achieve an efficient use of wireless resources by conducting packet forwarding through edges. A reinforcement learning algorithm is used to optimize the last two-hop communications in order to improve the adaptiveness of the communication routes. The proposed scheme selects different edge nodes for different types of communications with different context information such as connection-dependency (connection-dependent or connection-independent), communication type (unicast or broadcast), and packet payload size. We launch extensive simulations to evaluate the proposed scheme by comparing with existing broadcast protocols and unicast protocols for various network conditions and traffic patterns.
    研究論文(学術雑誌), 英語
  • Learning for Adaptive Anycast in Vehicular Delay Tolerant Networks
    Celimuge Wu; Tsutomu Yoshinaga; Dabhur Bayar; Yusheng Ji
    Journal of Ambient Intelligence and Humanized Computing, Springer Berlin Heidelberg, 1, 10, 2018年05月12日, 査読付, 10.1007/s12652-018-0819-y
    研究論文(その他学術会議資料等), 英語
  • Cluster-Based Content Distribution Integrating LTE and IEEE 802.11p with Fuzzy Logic and Q-Learning
    Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Lin Zhang; Yusheng Ji
    IEEE Computational Intelligence Magazine, Institute of Electrical and Electronics Engineers Inc., 13, 1, 41, 50, 2018年02月01日, 査読付, 10.1109/MCI.2017.2773818, There is an increasing demand for distributing a large amount of content to vehicles on the road. However, the cellular network is not sufficient due to its limited bandwidth in a dense vehicle environment. In recent years, vehicular ad hoc networks (VANETs) have been attracting great interests for improving communications between vehicles using infrastructure-less wireless technologies. In this paper, we discuss integrating LTE (Long Term Evolution) with IEEE 802.11p for the content distribution in VANETs. We propose a two-level clustering approach where cluster head nodes in the first level try to reduce the MAC layer contentions for vehicle-tovehicle (V2V) communications, and cluster head nodes in the second level are responsible for providing a gateway functionality between V2V and LTE. A fuzzy logic-based algorithm is employed in the first-level clustering, and a Q-learning algorithm is used in the second-level clustering to tune the number of gateway nodes. We conduct extensive simulations to evaluate the performance of the proposed protocol under various network conditions. Simulation results show that the proposed protocol can achieve 23% throughput improvement in highdensity scenarios compared to the existing approaches.
    研究論文(学術雑誌), 英語
  • A learning-based probabilistic routing protocol for vehicular delay tolerant networks
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Proceedings of 4th International Conference on Information and Communication Technologies for Disaster Management (ICT-DM2017), IEEE, 1, 6, 2017年12月12日, 査読付, 10.1109/ICT-DM.2017.8275695, We propose a probabilistic routing protocol for VDTNs. The protocol takes into account the vehicle velocity, node centrality, and node buffer size using a fuzzy logic-based approach.
    研究論文(国際会議プロシーディングス), 英語
  • Vehicular multi-access edge computing with licensed sub-6 GHz, IEEE 802.11p and mmWave
    Qitu Hu; Celimuge Wu; Xiaobing Zhao; Xianfu Chen; Yusheng Ji; Tsutomu Yoshinaga
    IEEE Access, Institute of Electrical and Electronics Engineers Inc., 6, 1, 1995, 2004, 2017年12月07日, 査読付, 10.1109/ACCESS.2017.2781263, With the rapid increase of vehicular Internet of things applications, it is urgent to design a mobile edge computing architecture, which is possible to distribute and process a large amount of contents with vehicles on the road. From a communication perspective, the current cellular technology faces challenges due to the limited bandwidth in a dense vehicle environment. In this paper, we propose a multi-access edge computing framework and the corresponding communication protocol which integrates licensed Sub-6 GHz band, IEEE 802.11p, and millimeter wave (mmWave) communications for the content distribution and processing in vehicular networks. The proposed protocol uses a cluster-based approach, where a fuzzy logic-based algorithm is employed to select efficient gateway nodes which bridge the licensed Sub-6 GHz communication and the mmWave communication in order to maximize the overall network throughput. IEEE 802.11p vehicle-to-vehicle communication is used to share information among vehicles in order to achieve efficient clustering. We conduct extensive simulations to evaluate the performance of the proposed protocol under various network conditions. Simulation results show that the proposed protocol can achieve significant improvements in various scenarios compared with the existing approaches.
    研究論文(学術雑誌), 英語
  • Cooperative Content Delivery in Vehicular Networks with Integration of Sub-6 GHz and mmWave
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Proc. of the IEEE Global Communications Conference Workshops, IEEE, 6 pages, 2017年12月04日, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Pipelined parallel join and its FPGA-based acceleration
    Masato Yoshimi; Yasin Oge; Tsutomu Yoshinaga
    ACM Transactions on Reconfigurable Technology and Systems, Association for Computing Machinery, 10, 4, 28:1, 28:8, 2017年12月01日, 査読付, 10.1145/3079759, A huge amount of data is being generated and accumulated in data centers, which leads to an important increase in the required energy consumption to analyze these data. Thus, we must consider the redesign of current computer systems architectures to be more friendly to applications based on distributed algorithms that require a high data transfer rate. Novel computer architectures that introduce dedicated accelerators to enable near-data processing have been discussed and developed for high-speed big-data analysis. In this work, we propose a computer system with an FPGA-based accelerator, namely, interconnected-FPGAs, which offers two advantages: (1) direct data transmission and (2) offloading computation into data-flow in the FPGA. In this article, we demonstrate the capability of the proposed interconnected-FPGAs system to accelerate join operations in a relational database. We developed a newparallel join algorithm, PPJoin, targeted to big-data analysis in a shared-nothing architecture. PPJoin is an extended version of the NUMA-based parallel join algorithm, created by overlapping computation by multicore processors and data communication. The data communication between computational nodes can be accelerated by direct data transmission without passing through the main memory of the hosts. To confirm the performance of the PPJoin algorithm and its acceleration process using an interconnected-FPGA platform, we evaluated a simple query for large tables. Additionally, to support availability, we also evaluated the actual benchmark query. Our evaluation results confirm that the PPJoin algorithm is faster than a software-based query engine by 1.5-5 times. Moreover, we experimentally confirmed that the direct data transmission by interconnected FPGAs reduces computational time around 20% for PPJoin. 2017 Copyright is held by the owner/author(s).
    研究論文(学術雑誌), 英語
  • Color-Based Cooperative Cache and Its Routing Scheme for Telco-CDNs
    Takuma Nakajima; Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E100D, 12, 2847, 2856, 2017年12月, 査読付, 10.1587/transinf.2017PAP0014, Cooperative caching is a key technique to reduce rapid growing video-on-demand's traffic by aggregating multiple cache storages. Existing strategies periodically calculate a sub-optimal allocation of the content caches in the network. Although such technique could reduce the generated traffic between servers, it comes with the cost of a large computational overhead. This overhead will be the cause of preventing these caches from following the rapid change in the access pattern. In this paper, we propose a light-weight scheme for cooperative caching by grouping contents and servers with color tags. In our proposal, we associate servers and caches through a color tag, with the aim to increase the effective cache capacity by storing different contents among servers. In addition to the color tags, we propose a novel hybrid caching scheme that divides its storage area into colored LFU (Least Frequently Used) and no-color LRU (Least Recently Used) areas. The colored LFU area stores color-matching contents to increase cache hit rate and no-color LRU area follows rapid changes in access patterns by storing popular contents regardless of their tags. On the top of the proposed architecture, we also present a new routing algorithm that takes benefit of the color tags information to reduce the traffic by fetching cached contents from the nearest server. Evaluation results, using a backbone network topology, showed that our color-tag based caching scheme could achieve a performance close to the sub-optimal one obtained with a genetic algorithm calculation, with only a few seconds of computational overhead. Furthermore, the proposed hybrid caching could limit the degradation of hit rate from 13.9% in conventional non-colored LFU, to only 2.3%, which proves the capability of our scheme to follow rapid insertions of new popular contents. Finally, the color-based routing scheme could reduce the traffic by up to 31.9% when compared with the shortest-path routing.
    研究論文(学術雑誌), 英語
  • A Light-weight Cooperative Caching Strategy by D2D Content Sharing
    Takayuki Shiroma; Takuma Nakajima; Celumuge Wu; Tsutomu Yoshinaga
    Proc. of the Fifth International Symposium on Computing and Networking (CANDAR 2017), IEEE, 159, 165, 2017年11月20日, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • V2R Communication Protocol Based on Game Theory Inspired Clustering
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    Proc. of IEEE 86th Vehicular Technology Conference (VTC2017-Fall), 1, 5, 2017年09月24日, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Scalable Photonic Networks-on-Chip Architecture Based on a Novel Wavelength-Shifting Mechanism
    A. Ben Ahmed; Tsutomu Yoshinaga; A. Ben Abdallah
    IEEE Transactions on Emerging Topics in Computing (April-June 2020), IEEE, 8, 2, 533, 544, 2017年08月09日, 査読付, 10.1109/TETC.2017.2737016, We propose in this paper an alternative to these two conventional PNoC architectures. Our proposed system is based on a novel Wavelength-Shifting mechanism, which combines the benefits of the previously mentioned schemes while limiting their drawbacks.
    研究論文(学術雑誌), 英語
  • A Reinforcement Learning-Based Data Storage Scheme for Vehicular Ad Hoc Networks
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Tutomu Murase; Yan Zhang
    IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 66, 7, 6336, 6348, 2017年07月, 査読付, 10.1109/TVT.2016.2643665, Vehicular ad hoc networks (VANETs) have been attracting interest for their potential roles in intelligent transport systems (ITS). In order to enable distributed ITS, there is a need to maintain some information in the vehicular networks without the support of any infrastructure such as road side units. In this paper, we propose a protocol that can store the data in VANETs by transferring data to a new carrier (vehicle) before the current data carrier is moving out of a specified region. For the next data carrier node selection, the protocol employs fuzzy logic to evaluate instant reward by taking into account multiple metrics, specifically throughput, vehicle velocity, and bandwidth efficiency. In addition, a reinforcement learning-based algorithm is used to consider the future reward of a decision. For the data collection, the protocol uses a cluster-based forwarding approach to improve the efficiency of wireless resource utilization. We use theoretical analysis and computer simulations to evaluate the proposed protocol.
    研究論文(学術雑誌), 英語
  • DTN-based Vehicular Cloud for Post-disaster Information Sharing
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    2017 WIRELESS DAYS, IEEE, 167, 172, 2017年, 査読付, We first propose a framework which utilizes vehicular delay tolerant network (DTN) to form a vehicular cloud in order to provide information exchange without communication infrastructure. The framework does not rely on cellular network and therefore provides an approach which is suitable for post-disaster communication where cellular network is unavailable or severely congested. The paper also proposes a protocol which is able to provide vehicle-to-cloud communication in frequently changing vehicular environment. The protocol takes into account the link throughput, additional signal coverage, connection time, and the probability to encounter a RSU for the forwarder selection by using a fuzzy logic-based approach. The protocol also employs a network coding approach to reduce the overhead while maintaining a high data delivery ratio. We use computer simulations to evaluate the proposed framework.
    研究論文(国際会議プロシーディングス), 英語
  • Multihop Data Delivery Virtualization for Green Decentralized IoT
    Lifeng Zhang; Celimuge Wu; Tsutomu Yoshinaga; Xianfu Chen; Tutomu Murase; Yusheng Ji
    Wireless Communications and Mobile Computing, Hindawi Limited, 2017, 9805784, 9 pages, 2017年, 査読付, 10.1155/2017/9805784, Decentralized communication technologies (i.e., ad hoc networks) provide more opportunities for emerging wireless Internet of Things (IoT) due to the flexibility and expandability of distributed architecture. However, the performance degradation of wireless communications with the increase of the number of hops becomes the main obstacle in the development of decentralized wireless IoT systems. The main challenges come from the difficulty in designing a resource and energy efficient multihop communication protocol. Transmission control protocol (TCP), the most frequently used transport layer protocol for achieving reliable end-to-end communications, cannot achieve a satisfactory result in multihop wireless scenarios as it uses end-to-end acknowledgment which could not work well in a lossy scenario. In this paper, we propose a multihop data delivery virtualization approach which uses multiple one-hop reliable transmissions to perform multihop data transmissions. Since the proposed protocol utilizes hop-by-hop acknowledgment instead of end-to-end feedback, the congestion window size at each TCP sender node is not affected by the number of hops between the source node and the destination node. The proposed protocol can provide a significantly higher throughput and shorter transmission time as compared to the end-to-end approach. We conduct real-world experiments as well as computer simulations to show the performance gain from our proposed protocol.
    研究論文(学術雑誌), 英語
  • Context-aware Unified Routing for VANETs Based on Virtual Clustering
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng J
    Proc. of the 2nd International Workshop on Vehicular Networking and Intelligent Transportation systems (VENITS'16), 281, 286, 2016年09月04日, 査読付, We propose a context-aware routing protocol for vehicular ad hoc networks (VANETs).
    研究論文(国際会議プロシーディングス), 英語
  • A Cooperative Forwarding Scheme for VANET Routing Protocols
    Celimuge Wu; Yusheng Ji; Tsutomu Yoshinaga
    ZTE Communications, Editorial Office of ZTE Communications, 14, 3, 13, 21, 2016年08月25日, 査読付, 10.399/j, In this paper, we propose a loss-tolerant scheme for unicast routing protocols in VANETs. The proposed scheme employs multiple forwarding nodes to improve the packet reception ratio at the forwarding nodes. T
    研究論文(学術雑誌), 英語
  • Accelerating BLAST Computation on an FPGA-enhanced PC Cluster
    Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
    2016 FOURTH INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 67, 76, 2016年, 査読付, 10.1109/CANDAR.2016.102, This paper introduces an FPGA-based scheme to accelerate mpiBLAST, which is a parallel sequence alignment algorithm for computational biology. Recent rapidly growing biological databases for sequence alignment require high-throughput storage and network rather than computing speed. Our scheme utilizes a specialized hardware configured on an FPGA-board which connects flash storage and other FPGA-boards directly. The specialized hardware configured on the FPGAs, we call a Data Stream Processing Engine (DSPE), take a role for preprocessing to adjust data for high-performance multi-and many-core processors simultaneously with offloading system-calls for storage access and networking. DSPE along the datapath achieves in-datapath computing which applies operations for data streams passing through the FPGA. Two functions in mpiBLAST are implemented using DSPE to offload operations along the datapath. The first function is database partitioning, which distributes the biological database to multiple computing nodes before commencing the BLAST processes. Using DSPE, we observe a 20-fold improvement in computation time for the database partitioning operation. The second function is an early part of the BLAST process that determines the positions of sequences for more detailed computations. We implement IDP-BLAST (In-datapath BLAST), which annotates positions in data streams from solid-state drives. We show that IDP-BLAST accelerates the computation time of the preprocess of BLAST by a factor of three hundred by offloading heavy operations to the introduced special hardware.
    研究論文(国際会議プロシーディングス), 英語
  • A Light-weight Content Distribution Scheme for Cooperative Caching in Telco-CDNs
    Takuma Nakajima; Masato Yoshimi; Celimuge Wu; Tsutomu Yoshinaga
    2016 FOURTH INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 126, 132, 2016年, 査読付, 10.1109/CANDAR.2016.93, A key technique to reduce the rapid growing of video-on-demand's traffic is a cooperative caching strategy aggregating multiple cache storages. Many internet service providers have considered the use of cache servers on their networks as a solution to reduce the traffic. Existing schemes often periodically calculate a sub-optimal allocation of the content caches in the network. However, such approaches require a large computational overhead that cannot be amortized in a presence of frequent changes of the contents' popularities. This paper proposes a light-weight scheme for a cooperative caching that obtains a sub-optimal distribution of the contents by focusing on their popularities. This was made possible by adding color tags to both cache servers and contents. In addition, we propose a hybrid caching strategy based on Least Frequently Used (LFU) and Least Recently Used (LRU) schemes, which efficiently manages the contents even with a frequent change in the popularity. Evaluation results showed that our light-weight scheme could considerably reduce the traffic, reaching a sub-optimal result. In addition, the performance gain is obtained with a computation overhead of just a few seconds. The evaluation results also showed that the hybrid caching strategy could follow the rapid variation of the popularity. While a single LFU strategy drops the hit ratio by 13.9%, affected by rapid popularity changes, our proposed hybrid strategy could limit the degradation to only 2.3%.
    研究論文(国際会議プロシーディングス), 英語
  • Design and Evaluation of a Configurable Query Processing Hardware for Data Streams
    Yasin Oge; Masato Yoshimi; Takefumi Miyoshi; Hideyuki Kawashima; Hidetsugu Irie; Tsutomu Yoshinaga
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E98D, 12, 2207, 2217, 2015年12月, 査読付, 10.1587/transinf.2015EDP7203, In this paper, we propose Configurable Query Processing Hardware (CQPH), an FPGA-based accelerator for continuous query processing over data streams. CQPH is a highly optimized and minimal-overhead execution engine designed to deliver real-time response for high-volume data streams. Unlike most of the other FPGA-based approaches, CQPH provides on-the-fly configurability for multiple queries with its own dynamic configuration mechanism. With a dedicated query compiler, SQL-like queries can be easily configured into CQPH at run time. CQPH supports continuous queries including selection, group-by operation and sliding-window aggregation with a large number of overlapping sliding windows. As a proof of concept, a prototype of CQPH is implemented on an FPGA platform for a case study. Evaluation results indicate that a given query can be configured within just a few microseconds, and the prototype implementation of CQPH can process over 150 million tuples per second with a latency of less than a microsecond. Results also indicate that CQPH provides linear scalability to increase its flexibility (i.e., on-the-fly configurability) without sacrificing performance (i.e., maximum allowable clock speed).
    研究論文(学術雑誌), 英語
  • クラウド環境における計算資源の動的共有手法の提案と評価
    中島拓真; 吉見真聡; 入江英嗣; 吉永努
    電子情報通信学会論文誌D, 電子情報通信学会, J98-D, 8, 1142, 1150, 2015年08月05日, 査読付, 10.14923/transinfj.2014JDP7123
    研究論文(学術雑誌), 日本語
  • An Efficient Cache Grouping Strategy for Multinode Cache Networks
    Takayuki Shiroma; Takuma Nakajima; Kouta Nojima; Masato Yoshimi; Tsutomu Yoshinaga
    PROCEEDINGS OF 2015 THIRD INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 295, 298, 2015年, 査読付, 10.1109/CANDAR.2015.114, Popularizations of Video-On-Demand (VOD) services cause explosive and continuous growth of the Internet traffic. Web cache servers are widely utilized fot reducing such VOD traffic. However, ordinary cache strategies such as LRU often degrade cache efficiency of a multi-node cache network as popular contents are cached on all servers that squeezes the total amount of cache capacity. This paper proposes a novel strategy called Cache Grouping to improve cache efficiency in the multi-node cache network. The Cache Grouping organizes multiple web cache servers into a single cache server to increase virtual cache capacity and diversity of stored contents. Compared to a conventional cache strategy, the Cache Grouping reduces maximum 59% of web server transmissions and improves 20% of download time to process all requests while maintaining a total amount of transmissions.
    研究論文(国際会議プロシーディングス), 英語
  • Packet Size-Aware Broadcasting in VANETs With Fuzzy Logic and RL-Based Parameter Adaptation
    Celimuge Wu; Xianfu Chen; Yusheng Ji; Fuqiang Liu; Satoshi Ohzahata; Tsutomu Yoshinaga; Toshihiko Kato
    IEEE ACCESS, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 3, 2481, 2491, 2015年, 査読付, 10.1109/ACCESS.2015.2502949, Most existing multi-hop broadcast protocols for vehicular ad hoc networks do not consider the problem of how to adapt transmission parameters according to the network environment. Besides the propagation environment that determines the channel bit error rate, packet payload size has a significant effect on the packet loss rate. In this paper, we first discuss the effect of packet size on the packet reception ratio, and then propose a broadcast protocol that is able to specify the best relay node by taking into account the data payload size. The proposed protocol employs a fuzzy logic-based algorithm to jointly consider multiple metrics (link quality, inter-vehicle distance, and vehicle mobility) and uses a redundancy transmission approach to ensure high reliability. Since the fuzzy membership functions are tuned by using reinforcement learning, the protocol can adapt to various network scenarios. We use both real-world experiments and computer simulations to evaluate the proposed protocol.
    研究論文(学術雑誌), 英語
  • UDU-L:レーザポインティングによる柔軟なデバイス接続手法
    小木 真人; 大木 裕太; 吉永 努; 入江 英嗣
    電子情報通信学会論文誌, 一般社団法人電子情報通信学会, Vol. J97-D, No.1, 155, 164, 2014年01月, 査読付, ネットワークに接続できるデバイスが普及し,各々のデバイスがもつデータや機能をネットワーク上で共有するデバイス連携が増加している.しかし,既存技術によるデバイス接続では,対象デバイスをネットワーク上からユーザが手動で選択する必要があり,デバイス同士が物理的に近くにあっても,通信したいと思ったときにその場で接続を行うことは煩雑である.そこで,通信対象のデバイスに対して直観的に接続する方法として,レーザを利用した接続方法UDU-Lを提案する.UDU-Lは,可視光レーザを用いレーザポインタのように通信したいデバイスを直接指定する.このとき,レーザ光の明滅によって,対象デバイスへ接続に必要な情報を送信し通信を確立する.実装の結果,5m離れた対象デバイスを正確に指定して通信を行うことができた.また応用例として,手元の携帯端末内の画像をディスプレイへ転送・表示するアプリケーションを実装した.
    研究論文(学術雑誌), 日本語
  • An FPGA-based Tightly Coupled Accelerator for Data-intensive Applications
    Masato Yoshimi; Ryu Kudo; Yasin Oge; Yuta Terada; Hidetsugu Irie; Tsutomu Yoshinaga
    2014 IEEE 8TH INTERNATIONAL SYMPOSIUM ON EMBEDDED MULTICORE/MANYCORE SOCS (MCSOC), IEEE, 289, 296, 2014年, 査読付, 10.1109/MCSoC.2014.47, Computation beside a data source plays an important role in achieving a high performance with low energy consumption in Big Data processing. In contrast to that of a conventional workload, the processing of Big Data frequently requires that a massive amount of data in distributed storage be scanned. A key technique for reducing energy-consuming processor loads is to install a reconfigurable accelerator that is tightly coupled to a computational resource with interfaces. The accelerator is capable of configuring application-specific hardware modules to allow some logical and arithmetic operations for data stream transmission between interfaces, as well as the offloading of control protocols for communication with other computing nodes or storage. In this paper, an FPGA-based accelerator, which is directly attached to DRAM, the network, and storage, is proposed in order to realize an energy efficient computing system. A simple application that counts the words appearing in the data is implemented to evaluate a prototype system. As the accelerator outperforms by 80.66 to 429 times similar applications executed on an SSD-based Hadoop framework, we confirm that the accelerator's utilization for Big Data processing is beneficial.
    研究論文(国際会議プロシーディングス), 英語
  • Accelerating OLAP workload on interconnected FPGAs with Flash storage
    Masato Yoshimi; Ryu Kudo; Yasin Oge; Yuta Terada; Hidetsugu Irie; Tsutomu Yoshinaga
    2014 SECOND INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 440, 446, 2014年, 査読付, 10.1109/CANDAR.2014.87, The data volume used in online analytical processing (OLAP) applications is rapidly increasing because of the increasing popularity of various Web services and emerging sensor technologies. Since the amount of accumulated data is frequently too large to store in an in-memory database, it is necessary to have a secondary storage to store such big data. On the basis of this premise, the most important factor to determine the performance of data-intensive applications is to reduce the number and the size of the data transfers between the secondary storage and the main memory. To achieve an energy-efficient computing environment, offloading a user-defined function (UDF) onto interconnected FPGA-boards that equip high-speed storage is effective due to FPGA's performance ratio of operations per I/O. In this paper, we focus on the aggregate operations that are popularly used UDF in OLAP, and propose an acceleration scheme utilizing interconnected FPGAs with flash storage. The scheme is by introducing an accelerator modules which apply operations to data-stream passing through the FPGA, in addition to appropriate data distribution and partitioning. We implemented an accelerator module that aggregates the data transferred from the flash storage to the DRAM in order to show availability. Through preliminary evaluations of the accelerator, we confirmed that aggregate operations supported by the active-disk mechanism outperforms a software-based database management system by more than 30 times.
    研究論文(国際会議プロシーディングス), 英語
  • A Fully Optical Ring Network-on-Chip with Static and Dynamic Wavelength Allocation
    Ahmadou Dit Adi Cisse; Michihiro Koibuchi; Masato Yoshimi; Hidetsugu Irie; Tsutomu Yoshinaga
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E96D, 12, 2545, 2554, 2013年12月, 査読付, 10.1587/transinf.E96.D.2545, Silicon photonics Network-on-Chips (NoCs) have emerged as an attractive solution to alleviate the high power consumption of traditional electronic interconnects. In this paper, we propose a fully optical ring NoC that combines static and dynamic wavelength allocation communication mechanisms. A different wavelength-channel is statically allocated to each destination node for light weight communication. Contention of simultaneous communication requests from multiple source nodes to the destination is solved by a token based arbitration for the particular wavelength-channel. For heavy load communication, a multiwavelength-channel is available by requesting it in execution time from source node to a special node that manages dynamic allocation of the shared multiwavelength-channel among all nodes. We combine these static and dynamic communication mechanisms in a same network that introduces selection techniques based on message size and congestion information. Using a photonic NoC simulator based on Phoenixsim, we evaluate our architecture under uniform random, neighbor, and hotspot traffic patterns. Simulation results show that our proposed fully optical ring NoC presents a good performance by utilizing adequate static and dynamic channels based on the selection techniques. We also show that our architecture can reduce by more than half, the energy consumption necessary for arbitration compared to hybrid photonic ring and mesh NoCs. A comparison with several previous works in term of architecture hardware cost shows that our architecture can be an attractive cost-performance efficient interconnection infrastructure for future SoCs and CMPs.
    研究論文(学術雑誌), 英語
  • FLAT: MPIを埋め込み可能なGPUプログラミングフレームワーク
    島圭吾; 吉見真聡; 三好健文; 近藤正章; 入江英嗣; 本多弘樹; 吉永努
    情報処理学会論文誌コンピューティングシステム, 6, 4, 105, 116, 2013年10月, 査読付, GPU搭載PCクラスタで動作するプログラムは,GPU上の処理を記述するコードと通信処理を行うCPUのコードで構成される.GPUコードは並列化されたアルゴリズムを高速に実行し,CPUはノード間の通信処理を担当する.ノード間通信にはMPIの利用が一般的だがGPUコードには記述できないため,並列化の効果を引き出すためには,プログラマはCPUとGPUのデータの移動を考えつつCPUコードとGPUコードを並行して実装することになる.そこで,GPU間のデータ通信に関わるプログラミングコストを低減させるために,MPIを埋め込み可能なGPUプログラミングフレームワーク"FLAT"を提案する.FLATを用いることでGPUコードにMPI関数が記述できるようになるため,GPU間で転送されるデータが明確化される.本論文では,まず,FLATの実行モデルと実装方法について述べる.その後,LivermoreループLoop18,オプティカルフロー計算の2つの実プログラムを用いてFLATの有効性と実行性能を示す.実験の結果,GPUコードの計算粒度が粗粒度の場合,FLATの利用による性能低下率は,3%以下であることが確認された.A program for a PC cluster which equips GPUs consists of two types of code, for GPUs and for CPUs. The GPU code executes parallelized algorithms to introduce high speed computing supported by a CPU code which performs communication with other nodes. Although MPI library is commonly utilized to transfer data in the CPU code, MPI functions can not be written in the GPU code. Programmers are forced to implement CPU and GPU codes alternately with taking care of data movement among nodes. In order to reduce software development costs, we propose a programming framework called FLAT which enables GPU codes to embed MPI functions. This paper describes execution model and implementation of FLAT, and discusses availability and performance obtained by two case studies, Livermore Loop18 and optical flow programs. Through the experimental results, we confirmed that FLAT increases readability in synthesized GPU codes with maintaining bearable performance degradation, which is less than 3% for a coarse-grained parallel program.
    研究論文(学術雑誌), 日本語
  • 配線アクティビティを考慮した3次元積層プロセッサ向けフロアプランナー
    入江英嗣; 稲場朋大; 放地宏佳; 藤原大輔; 眞島一貴; 吉見真聡; 吉永努
    情報処理学会ACS論文誌, 情報処理学会, 6, 3, 131, 145, 2013年09月25日, 査読付, 本研究では,パイプラインシミュレータと連携して,モジュール間の通信頻度を考慮する3次元モジュールマッパを提案し,3次元プロセッサのフロアプランおよびそのアーキテクチャへの影響を明らかにする.提案モジュールマッパの出力結果からは,3次元構造を利用した効率的なデータパスやキャッシュ配置が確認された.3層,TSVの配線容量を30μmの通常配線と同等と仮定したときのフロアプランでは,2次元実装に比べて面積を34%,ロングワイヤ電力の近似値である配線アクティビティ値を57%まで削減し,従来のフロアプランナによる3次元実装に対して10%の配線アクティビティ値削減となった.
    研究論文(学術雑誌), 日本語
  • Variable Color Environment System using Heart Rate Variability
    Naoko Kanda; Daiki Sakuma; Masato Yoshimi; Tsutomu Yoshinaga; Hidetugu Irie
    Proc. of the 2013 International Conference on Bioinformatics & Computational Biology (BIOCOMP'13), 1-BIOCOMP-6, 2013年07月, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Wire-speed implementation of sliding-window aggregate operator over out-of-order data streams
    Yasin Oge; Masato Yoshimi; Takefumi Miyoshi; Hideyuki Kawashima; Hidetsugu Irie; Tsutomu Yoshinaga
    Proceedings - IEEE 7th International Symposium on Embedded Multicore/Manycore System-on-Chip, MCSoC 2013, IEEE Computer Society, 55, 60, 2013年, 査読付, 10.1109/MCSoC.2013.23, This paper shows the design and evaluation of an FPGA-based accelerator for sliding-window aggregation over data streams with out-of-order data arrival. We propose an order-agnostic hardware implementation technique for windowing operators based on a one-pass query evaluation strategy called Window-ID, which is originally proposed for software implementation. The proposed implementation succeeds to process out-of-order data items, or tuples, at wire speed due to the simultaneous evaluations of overlapping sliding-windows. In order to verify the effectiveness of the proposed approach, we have also implemented an experimental system as a case study. Our experiments demonstrate that the proposed accelerator with a network interface achieves an effective throughput around 760 Mbps or equivalently nearly 6 million tuples per second, by fully utilizing the available bandwidth of the network interface. © 2013 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • An Efficient and Scalable Implementation of Sliding-Window Aggregate Operator on FPGA
    Yasin Oge; Masato Yoshimi; Takefumi Miyoshi; Hideyuki Kawashima; Hidetsugu Irie; Tsutomu Yoshinaga
    2013 FIRST INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 112, 121, 2013年, 査読付, 10.1109/CANDAR.2013.23, This paper presents an efficient and scalable implementation of an FPGA-based accelerator for sliding-window aggregates over disordered data streams. With an increasing number of overlapping sliding-windows, the window aggregates have a serious scalability issue, especially when it comes to implementing them in parallel processing hardware (e.g., FPGAs). To address the issue, we propose a resource-efficient, scalable, and order-agnostic hardware design and its implementation by examining and integrating two key concepts, called Window-ID and Pane, which are originally proposed for software implementation, respectively. Evaluation results show that the proposed implementation scales well compared to the previous FPGA implementation in terms of both resource consumption and performance. The proposed design is fully pipelined and our implementation can process out-of-order data items, or tuples, at wire speed up to 200 million tuples per second.
    研究論文(国際会議プロシーディングス), 英語
  • A real-time gait improvement tool using a smartphone
    Hirotaka Kashihara; Hiroki Shimizu; Hiroyoshi Houchi; Masato Yoshimi; Tsutomu Yoshinaga; Hidetsugu Irie
    ACM International Conference Proceeding Series, 243, 2013年, 査読付, 10.1145/2459236.2459283, Recent handy devices are provided with various sensors and have realized a lot of functions as downsizing and speeding up of computers. Currently smartphones occupy significant positions as the multifunctional handy devices. One of the most observable feature is that the users carry the smartphone whenever leaving home. Analyzing the motion measured by such device can be useful to improve lifestyle habits. Gaits should be focused as the representative behavior of daily living, which is shown by the fact that there are a lot of exercises intended to improve gaits. Copyright 2013 ACM.
    研究論文(国際会議プロシーディングス), 英語
  • A fast handshake join implementation on FPGA with adaptive merging network
    Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
    ACM International Conference Proceeding Series, No.44 (4 pages), 2013年, 査読付, 10.1145/2484838.2484868, One of a critical design issues for implementing handshake-join hardware is result collection performed by a merging network. To address the issue, we introduce an adaptive merging network. Our implementation achieves over 3 million tuples per second when the selectivity is 0.1. The proposed implementation attains up to 5.2x higher throughput than original handshake-join hardware. In this demonstration, we apply the proposed technique to filter out malicious packets from packet streams. To the best of our knowledge, our system is the fastest handshake join implementation on FPGA. Copyright © 2013 ACM.
    研究論文(国際会議プロシーディングス), 英語
  • Sharing Computing Resources with Virtual Machines by Transparent Data Access
    Takuma Nakajima; Masato Yoshimi; Hidetsugu Irie; Tsutomu Yoshinaga
    2013 FIRST INTERNATIONAL SYMPOSIUM ON COMPUTING AND NETWORKING (CANDAR), IEEE, 359, 365, 2013年, 査読付, 10.1109/CANDAR.2013.64, Cloud computing has rapid growth in enterprise and academic areas. Computing platform makes up the transition from physical servers to virtual machines (VMs) in the cloud. Instead of many advantages, VMs remain several problems to employ effective utilization of physical computing resources, especially many-core accelerators. Even though GPGPU is a hopeful solution for high-load applications, existing methods to utilize GPUs from VMs are subjected to various restraints. In order to solve this problem, we propose a flexible method to share external computing resources by providing transparent access for data in the VMs. By committing commands to a computing host which processes the jobs as substitution, VMs can process high load jobs as necessary even if the VM has a tiny configuration. The computing host mounts the working directories in the VMs and enqueues jobs committed by the VMs. Experimental results show that the overhead of our implementation is sufficiently small in the low I/O load processes.
    研究論文(国際会議プロシーディングス), 英語
  • Using Cacheline Reuse Characteristics for Prefetcher Throttling
    Hidetsugu Irie; Takefumi Miyoshi; Goki Honjo; Kei Hiraki; Tsutomu Yoshinaga
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E95D, 12, 2928, 2938, 2012年12月, 査読付, 10.1587/transinf.E95.D.2928, One of the significant issues of processor architecture is to overcome memory latency. Prefetching can greatly improve cache performance, but it has the drawback of cache pollution, unless its aggressiveness is properly set. Several techniques that have been proposed for prefetcher throttling use accuracy as a metric, but their robustness were not sufficient because of the variations in programs' working set sizes and cache capacities. In this study, we revisit prefetcher throttling from the viewpoint of data lifetime. Exploiting the characteristics of cache line reuse, we propose Cache-Convection-Control-based Prefetch Optimization Plus (CCCPO+), which enhances the feedback algorithm of our previous CCCPO. Evaluation results showed that this novel approach achieved a 30% improvement over no prefetching in the geometric mean of the SPEC CPU 2006 benchmark suite with 256 KB LLC, 1.8% over the latest prefetcher throttling, and 0.5% over our previous CCCPO. Moreover, it showed superior stability compared to related works, while lowering the hardware cost.
    研究論文(学術雑誌), 英語
  • Design and Implementation of a Handshake Join Architecture on FPGA
    Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E95D, 12, 2919, 2927, 2012年12月, 査読付, 10.1587/transinf.E95.D.2919, A novel design is proposed to implement highly parallel stream join operators on a field-programmable gate array (FPGA), by examining handshake join algorithm for hardware implementation. The proposed design is evaluated in terms of the hardware resource usage, the maximum clock frequency, and the performance. Experimental results indicate that the proposed implementation can handle considerably high input rates, especially at low match rates. Results of simulation conducted to optimize size of buffers included in join and merge units give a new intuition regarding static and adaptive buffer tuning in handshake join.
    研究論文(学術雑誌), 英語
  • A Token-based Fully Photonic Network-on-Chip with Dynamic Wavelength Allocation
    P. Qiu; C.A.D. Adi; H. Irie; T. Yoshinaga
    Proc. of the International Workshop on Modern Science and Technology (IWMST 2012), 39, 44, 2012年08月
    研究論文(国際会議プロシーディングス), 英語
  • FLAT: A GPU programming framework to provide embedded MPI
    Takefumi Miyoshi; Hidetsugu Irie; Keigo Shima; Hiroki Honda; Masaaki Kondo; Tsutomu Yoshinaga
    ACM International Conference Proceeding Series, 20, 29, 2012年, 査読付, 10.1145/2159430.2159433, For leveraging multiple GPUs in a cluster system, it is necessary to assign application tasks to multiple GPUs and execute those tasks with appropriately using communication primitives to handle data transfer among GPUs. In current GPU programming models, communication primitives such as MPI functions cannot be used within GPU kernels. Instead, such functions should be used in the CPU code. Therefore, programmer must handle both GPU kernel and CPU code for data communications. This makes GPU programming and its optimization very difficult. In this paper, we propose a programming framework named FLAT which enables programmers to use MPI functions within GPU kernels. Our framework automatically transforms MPI functions written in a GPU kernel into runtime routines executed on the CPU. The execution model and the implementation of FLAT are described, and the applicability of FLAT in terms of scalability and programmability is discussed. We also evaluate the performance of FLAT. The result shows that FLAT achieves good scalability for intended applications. © 2012 ACM.
    研究論文(国際会議プロシーディングス), 英語
  • Design and implementation of a merging network architecture for handshake join operator on fpga
    Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
    Proceedings - IEEE 6th International Symposium on Embedded Multicore SoCs, MCSoC 2012, 84, 91, 2012年, 査読付, 10.1109/MCSoC.2012.21, A novel merging network architecture is proposed for a handshake join operator in order to achieve much higher data throughput than ever before. Handshake join is a highly parallelized algorithm for window-based stream joins. Result collection performed by a merging network is a significant design issue for the handshake join operator because the merging network becomes an overwhelming bottleneck for scalable performance. To address the issue, an adaptive merging network is proposed for hardware implementation of the algorithm. The proposed architecture is implemented on an FPGA and it is evaluated in terms of the hardware resource usage, the maximum clock frequency, and the performance. Experimental results demonstrate up to 16.3 times higher throughput than nested loops-style join implementation without dropping any tuples. To the best of our knowledge, this is the best performance for handshake join operator implemented on an FPGA. © 2012 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • Parallel Numerical Simulation of Visual Neurons for Analysis of Optical Illusion
    Akira Egashira; Shunji Satoh; Hidetsugu Irie; Tsutomu Yoshinaga
    2012 THIRD INTERNATIONAL CONFERENCE ON NETWORKING AND COMPUTING (ICNC 2012), IEEE, 130, 136, 2012年, 査読付, 10.1109/ICNC.2012.27, Detailed mechanism of optical illusion caused by visual neurons in human brain has not been well understood, and its numerical simulation is helpful to analyze visual system of humans. This paper describes implementation techniques of parallel numerical simulation to help understanding optical illusion by using a GPU-accelerated PC cluster. Our parallel acceleration techniques include following three points. Firstly, input images of the numerical simulation is efficiently calculated by dividing it images for multiple computation nodes using MPI (Message Passing Interface). Secondly, convolution, which is dominated computation for the optical flow, is accelerated by GPU. Finally, an algorithm to compute convolution specified to analyze optical illusion is proposed to speed up the simulation. Our experimental results show an interesting insight that values of optical flow for images causing optical illusion are quite different compared to that does not cause the optical illusion. We also demonstrate that our implementation of simulation works efficiently on the GPU-accelerated PC cluster.
    研究論文(国際会議プロシーディングス), 英語
  • STRAIGHT: Realizing a Lightweight Large Instruction Window by using Eventually Consistent Distributed Registers
    Hidetsugu Irie; Daisuke Fujiwara; Kazuki Majima; Tsutomu Yoshinaga
    2012 THIRD INTERNATIONAL CONFERENCE ON NETWORKING AND COMPUTING (ICNC 2012), IEEE, 336, 342, 2012年, 査読付, 10.1109/ICNC.2012.66, As the number of cores as well as the network size in a processor chip increases, the performance of each core is more critical for the improvement of the total chip performance. However, to improve the total chip performance, the performance per power or per unit area must be improved, making it difficult to adopt a conventional approach of superscalar extension. In this paper, we explore a new core structure that is suitable for manycore processors. We revisit prior studies of new instruction-level (ILP) and thread-level parallelism (TLP) architectures and propose our novel STRAIGHT processor architecture. By introducing the scheme of distributed key-value-store to the register file of clustered microarchitectures, STRAIGHT directly executes the operation with large logical registers, which are written only once. By discussing the processor structure, microarchitecture, and code model, we show that STRAIGHT realizes both large instruction window and lightweight rapid execution, while suppressing the hardware and energy cost. Preliminary estimation results are promising, and show that STRAIGHT improves the single thread performance by about 30%, which is the geometric mean of the SPEC CPU 2006 benchmark suite, without significantly increasing the power and area budget.
    研究論文(国際会議プロシーディングス), 英語
  • Throttling control for bufferless routing in on-chip networks
    Yicheng Guan; Cisse Ahmadou Dit Adi; Takefumi Miyoshi; Michihiro Koibuchi; Hidetsugu Irie; Tsutomu Yoshinaga
    Proceedings - IEEE 6th International Symposium on Embedded Multicore SoCs, MCSoC 2012, 37, 44, 2012年, 査読付, 10.1109/MCSoC.2012.25, As the number of core integration on a single diegrows, buffers consume significant energy, and occupy chip area. A bufferless deflection routing that eliminates router's inputportbuffers can considerably help saving energy and chip areawhile providing similar performance of existing buffered routing, especially for low-to-medium network loads. However when congestion increases, the bufferless frequently causes flits deflections, and misrouting leading to a degradation of network performance. In this paper, we propose IRT(Injection Rate Throttling), a local throttling mechanism that reduces deflection and misrouting for high-load bufferless networks. IRT provides injection rate control independently for each network node, allowing to reduce network congestion. Our simulation results based on a cycle-accurate simulator show that using IRT, IRT reduces average transmission latency by 8.65% compared to traditional bufferless routing. © 2012 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • Computation-Communication Overlap of Linpack on a GPU-Accelerated PC Cluster
    Junichi Ohmura; Takefumi Miyoshi; Hidetsugu Irie; Tsutomu Yoshinaga
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E94D, 12, 2319, 2327, 2011年12月, 査読付, 10.1587/transinf.E94.D.2319, In this paper, we propose an approach to obtaining enhanced performance of the Linpack benchmark on a CPU-accelerated PC cluster connected via relatively slow inter-node connections. For one node with a quad-core Intel Xeon W3520 processor and a NVIDIA Testa C1060 CPU card, we implement a CPU-GPU parallel double-precision general matrix-matrix multiplication (dgemm) operation, and achieve a performance improvement of 34% compared with the CPU-only case and 64% compared with the CPU-only case. For an entire 16-node cluster, each node of which is the same as the above and is connected with two gigabit Ethernet links, we use a computation-communication overlap scheme with CPU acceleration for the Linpack benchmark, and achieve a performance improvement of 28% compared with the CPU-accelerated high-performance Unpack benchmark (HPL) without overlapping. Our overlap CPU acceleration solution uses overlaps in which the main inter-node communication and data transfer to the GPU device memory are overlapped with the main computation task on the CPU cores. These overlaps use multi-core processors, which almost all of today's high-performance computers use. In particular, as well as using a CPU core for communication tasks, we also simultaneously use other CPU cores and the CPU for computation tasks. In order to enable overlap between inter-node communication and computation tasks, we eliminate their close dependence by breaking the main computation task into smaller tasks and rescheduling. Based on a scheme in which part of the CPU computation power is simultaneously used for tasks other than computation tasks, we experimentally find the optimal computation ratio for CPUs; this ratio differs from the case of parallel dgemm operation of one node.
    研究論文(学術雑誌), 英語
  • ウィンドウ結合演算子の FPGAによる実現
    三好健文; 寺田裕太; 川島英之; 吉永努
    電子情報通信学会 論文誌B, 一般社団法人電子情報通信学会, J94-B, 10, 1313, 1322, 2011年10月, 査読付, 本論文では,ストリームデータのウィンドウ結合をFPGA上に実現する手法とアーキテクチャを提案する.提案アーキテクチャは二つのストリームデータの処理を並列に行い,かつそれをパイプライン処理することで高性能化を実現する.提案アーキテクチャは,2^<16>個のタプルに関するウィンドウ結合を実現し,1ms周期で発生するストリームデータを処理できることを示す.高性能化に起因して,出力結果タプルが欠落する問題が生じることを述べ,提案するアドミッション制御機構によりその問題を防ぐことを示す.
    研究論文(学術雑誌), 日本語
  • An Efficient Path Setup for a Hybrid Photonic Network-on-Chip
    C. A. D. Adi; H. Matsutani; M. Koibuchi; H. Irie; T. Miyoshi; T. Yoshinaga
    International Journal of Networking and Computing, 1, 2, 244, 259, 2011年07月, 査読付
    研究論文(学術雑誌), 英語
  • ストリーム処理エンジン向け動的再構成可能プロセッサアーキテクチャの設計
    三好健文; 寺田裕太; 川島英之; 吉永努
    情報処理学会データベーストランザクション, 情報処理学会, 4, 2, 35, 51, 2011年07月, 査読付, 動的再構成可能ストリーム処理エンジンDR-SPEのプロセッサアーキテクチャを提案する.ストリーム処理エンジンは,ときどき刻々と変化するデータの流れであるストリームデータに対して,SQLライクな宣言的クエリ言語を用いて,関係演算や算術演算を適用できる.DR-SPEは並列処理による高い処理性能を実現すると同時に,高速なクエリ登録や演算子実行順序切換えをサポートする専用ハードウェアによるストリーム処理エンジンである.DR-SPEが提供する演算子は,Streams on Wiresと同等である.本論文では,提案するアーキテクチャをFPGA XC6VLX240T-1上に実装し,クエリの構成時間および処理性能を評価する.評価の結果は,DR-SPEはStreams on Wiresと同等のスループットを実現しながら,85μ秒でクエリを構成できることを示す.A processor architecture of dynamic reconfigurable stream processing engine DR-SPE is proposed. By using declarative query language, stream processing engine is able to apply relational and arithmetic operations to stream data. DR-SPE is a special purpose hardware for stream processing, which achieves both of high processing performance by exploiting parallelism in target query and ability for query registration and execution order of operations at runtime. Available operations in DR-SPE are the same as ones in Streams on Wires. In this paper, DR-SPE is implemented on a FPGA XC6VLX240T-1, and its configuration time for operations and its performance are evaluated in real experiments. The result of experiments shows that DR-SPE realizes 85μ second on configuration of operations, which overwhelms Streams on Wires. Simultaneously, DR-SPE achieves comparable performance with Streams on Wires,
    研究論文(学術雑誌), 日本語
  • Prediction Router: A Low-Latency On-Chip Router Architecture with Multiple Predictors
    Hiroki Matsutani; Michihiro Koibuchi; Hideharu Amano; Tsutomu Yoshinaga
    IEEE TRANSACTIONS ON COMPUTERS, IEEE COMPUTER SOC, 60, 6, 783, 799, 2011年06月, 査読付, 10.1109/TC.2011.17, Multi and many-core applications are sensitive to interprocessor communication latencies, suggesting the need for low-latency on-chip networks. We propose a low-latency router architecture that predicts the output channel to be used by the next packet transfer and speculatively completes the switch arbitration to reduce communication latency. The packets coming into the prediction routers are transferred without waiting for the routing computation and switch arbitration if the prediction hits. Thus, the primary concern for reducing communication latency is the hit rates of the prediction algorithms, which vary based on network environments, such as the network topology, routing algorithm, and traffic pattern. Although typical low-latency routers that skip one or more pipeline stages use a bypass data path that is based on a static or single bypassing policy ( e. g., accelerating the packets moving in the same dimension), our prediction router architecture predictively forwards packets based on the prediction algorithm selected from among several candidates in response to the network environment. We analyze the prediction hit rates of five prediction algorithms on meshes, tori, fat trees, and Spidergons. Then, we present four case studies, each of which assumes different many-core architectures. We implemented the prediction routers for each case study by using a 45 nm CMOS process, and evaluated them in terms of the prediction hit rate, zero-load latency, hardware amount, and energy consumption. A typical prediction router with two or three predictors shows that although the area and energy are increased by 4.8-12.0 percent and 5.3 percent, respectively, up to 89.8 percent of the prediction hit rate is achieved in real applications, which provides favorable trade-offs between modest hardware/energy overheads and significant latency saving.
    研究論文(学術雑誌), 英語
  • 仮想リモートレプリケーションによる3拠点ストレージシステム制御方式
    牧晋広; 平岩友理; 今津剛行; 吉永努
    情報処理学会論文誌, 52, 2, 1, 13, 2011年02月, 査読付
    研究論文(学術雑誌), 日本語
  • A coarse grain reconfigurable processor architecture for stream processing engine
    Takefumi Miyoshi; Hideyuki Kawashima; Yuta Terada; Tsutomu Yoshinaga
    Proceedings - 21st International Conference on Field Programmable Logic and Applications, FPL 2011, 490, 495, 2011年, 査読付, 10.1109/FPL.2011.97, This paper proposes a processor architecture for DR-SPE, a dynamic reconfigurable stream processing engine. DR-SPE is special-purpose hardware for stream data processing, which achieves high processing performance by exploiting parallelism in the target query. It also handles query registration and execution order of operations at runtime. Available operations in DR-SPE are the same as those in Streams on Wires. In this paper, DR-SPE is implemented on a FPGA XC6VLX240T-1, and its performance is evaluated. The results of the evaluation show that DR-SPE achieves register modification within 506 μsec when the configuration path is driven at 1 Mbps, which is not achieved by Streams on Wires. DR-SPE also achieves flexibility and can support complicated queries by providing 10×10 operation units tiled onto an FPGA. DR-SPE achieves comparable operation throughput with Streams on Wires at the expense of requiring more LUTs. © 2011 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • Multi-GPU acceleration of optical flow computation in visual functional simulation
    Junichi Ohmura; Akira Egashira; Shunji Satoh; Takefumi Miyoshi; Hidetsugu Irie; Tsutomu Yoshinaga
    Proceedings - 2011 2nd International Conference on Networking and Computing, ICNC 2011, 228, 234, 2011年, 査読付, 10.1109/ICNC.2011.41, Numerical simulation for visual processing of the human brain is one of time-consuming applications. This paper shows acceleration techniques for a simulation program of the visual processing. We parallelize convolution calculations, which are core operations, which the simulation program requests, on a GPU-accelerated PC cluster. Our implementation includes three improvement points. Firstly, we consider efficient data mapping onto global and shared memories1 of the GPU. Secondly, multiple convolutions for the same input data are computed by each node's GPU, referred to as package execution. Finally, an input 2-dimensional image is divided into regions and convolutions for these regions are executed in parallel utilizing MPI (Message Passing Interface). Our experimental results show a linear speedup up to 12 nodes in the PC cluster for the convolution program. We also show the effects of the package execution and reduced communication on NVIDIA tesla C1060 and C2070, respectively. © 2011 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • CCCPO: Robust prefetcher optimization technique based on cache convection
    Hidetsugu Irie; Takefumi Miyoshi; Goki Honjo; Kei Hiraki; Tsutomu Yoshinaga
    Proceedings - 2011 2nd International Conference on Networking and Computing, ICNC 2011, 127, 133, 2011年, 査読付, 10.1109/ICNC.2011.26, One of the significant issues of processor architecture is to overcome memory latency. Prefetching can greatly improve cache performance, however, it has the drawback of cache pollution unless its aggressiveness is properly set. Although several techniques for prefetcher throttling have been proposed which use accuracy as a metric, their robustness were not sufficient due to the variations between program working set sizes and cache capacities. In this paper, we revisit cache behavior with the viwepoint of data lifetime in a cache with prefetching. Based on this observation Cache-Convection-Control-based Prefetch Optimization (CCCPO) is proposed, which exploits the characteristics of cache line reuse and controls the prefetcher aggressiveness. Evaluation results showed that this novel approach achieved 4.6% improvement against the most recent prefetcher throttling algorithms in the geometric mean of SPEC CPU 2006 benchmark suite with 256KB LLC. © 2011 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • An implementation of handshake join on FPGA
    Yasin Oge; Takefumi Miyoshi; Hideyuki Kawashima; Tsutomu Yoshinaga
    Proceedings - 2011 2nd International Conference on Networking and Computing, ICNC 2011, 95, 104, 2011年, 査読付, 10.1109/ICNC.2011.22, This paper shows an implementation of handshake join on field-programmable gate array (FPGA). Handshake join is one of stream join algorithms, proposed by Teubner and Mueller. It can support very high degrees of parallelism and attain unprecedented success in throughput speed in order to achieve efficient support for window-based join in streaming databases. In handshake join, it is necessary to take into account the problems with regard to the capacity of the output channel and the limitation of the internal buffer sizes, in order to apply join operation to input tuples efficiently in a correct manner. However, the implementation has not necessarily clarified in detail yet in their paper. In this paper, to solve the issues, we propose the merging network and the admission controller. Then we evaluate the architecture in terms of the hardware resource usage, the maximum clock frequency, and the operation performance. © 2011 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • Parallel matrix-matrix multiplication based on HPL with a GPU-accelerated PC cluster
    Qin Wang; Junichi Ohmura; Shan Axida; Takefumi Miyoshi; Hidetsugu Irie; Tsutomu Yoshinaga
    Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 243, 248, 2010年, 査読付, 10.1109/IC-NC.2010.39, In this paper, we propose an approach for significantly improving the performance of parallel matrix-matrix multiplication using a GPU-accelerated cluster. For one node, we implement a CPUs-GPU parallel double-precision general matrix-matrix multiplication (dgemm) operation and achieve a performance improvement of 32% as compared to the GPU-only case and 56% as compared to the CPUs-only case. For the entire cluster, we use the overlap GPU acceleration solution to high-performance Linpack (HPL), which eliminates the close dependency between the LU decomposition and the dgemm operation, and achieve a performance improvement of 17% as compared to the flat GPU acceleration case. © 2010 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • CODIE: Continuation-based overlapping data-transfers with instruction execution
    Takefumi Miyoshi; Kenji Kise; Hidetsugu Irie; Tsutomu Yoshinaga
    Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 71, 77, 2010年, 10.1109/IC-NC.2010.26, In this paper, a runtime system termed CODIE is proposed to execute sequential part of programs efficiently in a many-core architecture. All independent processing elements in a many-core architecture use a shared network and off-chip memory. Therefore, contentions on such resources substantially degrade the system performance. On the CODIE system, when a cache miss occurs, the system first initiates a data transfer operation. Next, the system creates a continuation of executing instructions related to the missing data. The continuation is stored into the buffer, and the instructions not related to the missing data are executed subsequently. In other words, data transfer and instruction executions can be performed simultaneously. In this way, the effect of the overhead of the updating cache entry (increased by memory access contention) is tolerated. The results of evaluation show that the proposed CODIE system realizes a 1.86x speed up of the execution of the sequential write/read program on the M-Core architecture at 36 cores and a 1.97x speed up of the execution of the blackscholes(from PARSEC benchmark suite) on the Cell/BE processor with 6 SPEs. © 2010 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • OREX: An Optical Ring with Electrical Crossbar Hybrid Photonic Network-on-Chip
    Cisse Ahmadou Dit Adi; Ping Qiu; Hidetsugu Irie; Takefumi Miyoshi; Tsutomu Yoshinaga
    2010 PROCEEDINGS OF THE INTERNATIONAL WORKSHOP ON INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS (IWIA 2010), IEEE, 3, 10, 2010年, 査読付, 10.1109/IWIA.2010.13, The role of network-on-chip (NoC) is becoming more important as the number of processing elements (PE) integration onto a single chip increases. Lowering power consumption while providing capability of high-performance communication is a challenging problem for the design of future NoCs. In this paper we propose OREX, which is a hybrid NoC consisting of an optical ring and an electrical crossbar central router. OREX takes advantage of both electrical and optical technology designs state-of-art to deliver a high data rate transfer NoC at an acceptable power consumption cost. Using a cycle accurate simulator, we evaluate the proposed hybrid NoC. Simulation experiment shows that OREX presents slightly better communication performance in terms of bandwidth and power consumption compare to a conventional hybrid photonic torus network.
    研究論文(国際会議プロシーディングス), 英語
  • An efficient path setup for a hybrid photonic Network-on-Chip
    Cisse Ahmadou Dit Adi; Hiroki Matsutani; Michihiro Koibuchi; Hidetsugu Irie; Takefumi Miyoshi; Tsutomu Yoshinaga
    Proceedings - 2010 1st International Conference on Networking and Computing, ICNC 2010, 156, 161, 2010年, 10.1109/IC-NC.2010.31, Electrical Network-on-Chip (NoC) faces critical challenges in meeting the high performance and low power consumption requirements for future multicore processors interconnection. Recent tremendous advances in CMOS compatible optical components give the potential for photonics to deliver an efficient NoC performance at an acceptable energy cost. However, the lack of in flight processing and buffering of optical data made the realization of a fully optical NoC complicated. A hybrid architecture which uses optical high bandwidth transfer and a tiny electrical control network can take advantage of both interconnection methods to offer an efficient performance-per-watt infrastructure to connect multicore processors and System-on-Chip (SoC). In this paper, we propose a hybrid photonic torus NoC (HPNoC) that uses a predictive switching to improve the performance of a hybrid architecture. By using prediction techniques, we can reduce the path set up latency for the electrical control network hence improving the overall end-to-end delay for communication in the HPNoC. Simulation results using a cycle accurate simulator under uniform, neighbor and bitreversal traffic patterns for 64 nodes show that predictive switching considerably improves the HPNoC overall performance. © 2010 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • 低遅延オンチップネットワークのための予測ルータの評価
    松谷宏紀; 鯉渕道絋; 天野英晴; 吉永努
    情報処理学会論文誌コンピューティングシステム, 2, 3, 26, 38, 2009年09月, 査読付
    研究論文(学術雑誌), 日本語
  • Prediction Router: Yet Another Low Latency On-Chip Router Architecture
    Hiroki Matsutani; Michihiro Koibuchi; Hideharu Amano; Tsutomu Yoshinaga
    HPCA-15 2009: FIFTEENTH INTERNATIONAL SYMPOSIUM ON HIGH-PERFORMANCE COMPUTER ARCHITECTURE, PROCEEDINGS, IEEE COMPUTER SOC, 367, +, 2009年, 査読付, Network-on-Chips (NoCs) are quite latency sensitive, since their communication latency strongly affects the application performance on recent many-core architectures. To reduce the communication latency, we propose a low-latency router architecture that predicts an output channel being used by the next packet transfer and speculatively completes the switch arbitration. In the prediction routers, incoming packets are transferred without waiting the routing computation and switch arbitration if the prediction hits. Thus, the primary concern for reducing the communication latency is the hit rates of prediction algorithms, which vary from the network environments, such as the network topology, routing algorithm, and traffic pattern. Although typical low-latency routers that speculatively skip one or more pipeline stages use a bypass datapath for specific packet transfers (e.g., packets moving on the same dimension), our prediction router predictively forwards packets based on a prediction algorithm selected from several candidates in response to the network environments. In this paper, we analyze the prediction hit rates of six prediction algorithms on meshes, tori, and fat trees. Then we provide three case studies, each of which assumes different many-core architecture. We have implemented a prediction router for each case study by using a 65nm CMOS process, and evaluated them in terms of the prediction hit rate, zero load latency, hardware amount, and energy consumption. The results show that although the area and energy are increased by 6.4-15.9% and 8.0-9.5% respectively, up to 89.8% of the prediction hit rate is achieved in real applications, which provide favorable trade-offs between the modest hardware/energy overheads and the latency saving.
    研究論文(国際会議プロシーディングス), 英語
  • 耐故障・適応デッドロック回復ルーティングのためのネットワーク再構成プロトコル
    吉永努; 西村康彦
    電子情報通信学会論文誌, 一般社団法人電子情報通信学会, 91-D, 12, 2881, 2891, 2008年12月, 並列分散処理計算機用の耐故障/適応ルーチングアルゴリズムとして,動的ネットワーク再構成によってルーチング機能を実行時に切り換える方式が提案されている.本論文では,ネットワーク再構成中に一つのPE (Processing Element)に排出可能なパケット数を設定し,排出パケット数がその値に達するまでネットワークへのパケット注入を継続する動的ネットワーク再構成プロトコルを提案する.これにより,ネットワーク再構成中のパケット注入待ち時間を減らす.対象とするルーチングアルゴリズムは,k-ary n-cube用の耐故障/適応デッドロック回復ルーチングとする.デッドロック回復にup^*/down^*ルーチングとL-turnルーチングを使用する16-ary 2-cubeネットワークについてシミュレーションを行った.提案するプロトコルは,従来の静的,及びパケット注入停止型プロトコルと比較して,ネットワーク再構成中のスループット維持とネットワーク再構成後の低遅延化に貢献することを示す.
    研究論文(学術雑誌), 日本語
  • ルールベースアクセス制御機能を持つDLNA情報家電の遠隔共有支援機構
    武藤大悟; 吉永努
    情報処理学会論文誌, 情報処理学会, 49, 12, 3985, 3996, 2008年12月, 査読付, 我々は,DLNA機器の接続範囲をホームネットワーク内から宅外·家庭間に拡張することを支援するワームホールデバイスと呼ぶソフトウェアを開発した.ワームホールデバイスは,既存のDLNA機器および家庭用UPnPルータとの接続性を持つとともに,SIPサーバを利用してホームネットワーク間の接続を一括して行う.また,ユーザの設定したルールに基づいてDLNA機器やコンテンツのアクセス制御を実現する.市販のDLNA機器や家庭用UPnPルータ,家庭向けインターネット接続サービスを用いた複数のホームネットワーク環境を構築し,相互接続とコンテンツ共有に関する実験を行った.その結果,実用的な遅延時間で遠隔接続とアクセス制御を実現できることが分かった.We developed a software named wormhole device (WD) which supports remote connection of DLNA equipment between two home networks. WD has interoperability with existing DLNA products and household UPnP broadband routers. It utilizes a SIP server to establish remote connection with assisting NAT-Traversal for popular home network environments. It also supports access control functions to share remote DLNA equipments and their contents based on rules which are specified by users. We constructed experiments simulating home networks that are connected to the internet through commercial network providers and using different DLNA-enable device for each home. The experiments examined both remote connection and contents sharing. We show the results that WD realizes safe and easy remote contents sharing as well as access control with acceptable latency.
    研究論文(学術雑誌), 日本語
  • 予測機構を持つルータを用いた低遅延チップ内ネットワークに関する研究
    鯉渕道絋; 吉永努; 村上弘和; 松谷宏紀; 天野英晴
    情報処理学会論文誌ACS23, 1, 2, 59, 69, 2008年08月, 査読付
    研究論文(学術雑誌), 日本語
  • 2-Dトーラスネットワークにおける動的通信予測による低遅延化
    吉永 努; 村上 弘和; 鯉渕 道絋
    情報処理学会論文誌, 1, 1 (ACS22), 28, 39, 2008年05月, 査読付
    研究論文(学術雑誌), 日本語
  • The QC-2 parallel Queue processor architecture
    Ben A. Abderazek; Arquimedes Canedo; Tsutomu Yoshinaga; Masahiro Sowa
    JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, ACADEMIC PRESS INC ELSEVIER SCIENCE, 68, 2, 235, 245, 2008年02月, 査読付, 10.1016/j.jpdc.2007.08.004, Queue based instruction set architecture processor offers an attractive option in the design of embedded systems. In our previous work, we proposed a novel queue processor architecture as a starting point for hardware/software design space exploration for embedded applications. In this paper, we present a high performance 32-bit Synthesizable QueueCore (QC-2)-an improved and optimized version of the produced order parallel Queue processor (PQP), with single precision floating-point support. The QC-2 core also implements a novel technique used to extend immediate values and memory instruction offsets that were otherwise not representable because of bit-width constraints in the PQP processor.
    A prototype implementation is produced by synthesizing the high-level model for a target FPGA device. We present the architecture description and design results in a fair amount of details. (c) 2007 Elsevier Inc. All rights reserved.
    研究論文(学術雑誌), 英語
  • Impact of predictive switching in 2-D torus networks
    Tsutomu Yoshinaga; Hirokazu Murakami; Michihiro Koibuchi
    INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 11, +, 2007年, 査読付, 10.1109/IWIA.2007.8, Predictive switching is a technique for reducing message latency in parallel computer networks. It tries to decide traversal paths of messages by utilizing a prediction mechanism so that processing time for message headers can be shortened. A key issue of predictive switching is the overhead of prediction failures. This paper presents simple and efficient treatments of prediction failures. Our proposal includes three schemes. The first scheme is arranging predictive and non-predictive routers in a network to safely detect and discard mis-predicted packets. The second is additional hardware to reduce occurrences of mis-predicted packets. The third scheme is to shorten the mis-predicted packets. We show the impact of predictive switching embodying the three schemes for k-ary 2-cubes (k = 8, 16, 32) with dimension-order routing. Our simulation results demonstrate that we can reduce average message latency by minimizing the prediction failure overhead. Network saturation throughput is also improved when the predictor's accuracy is high.
    研究論文(国際会議プロシーディングス), 英語
  • Mathematical model for multiobjective synthesis of NoC architectures
    Ben A. Abderazek; Mushfiquzzaman Akanda; Tsutomu Yoshinaga; Masahiro Sowa
    Proceedings of the International Conference on Parallel Processing Workshops, CD, 2007年, 査読付, 10.1109/ICPPW.2007.50, Network-on-Chip (NoC) interconnections have been proposed to overcome the problems associated with long wires used in chip wide communications. They support asynchronous transfer of communication between cores within multicore systems-on-chips (MCSoCs). The design of such architectures is crucial for achieving high performance and energy efficient systems. However, the effectiveness of NoC based design depends on the adopted design methodology. Automatic design approach is highly desirable to increase system design productivity. This paper presents a new mathematical formulation for synthesizing application specific NoC architectures, such that the performance constraints are satisfied and the communication power consumption is minimized. © 2007 IEEE.
    研究論文(国際会議プロシーディングス), 英語
  • High-level modeling and FPGA prototyping of produced order parallel queue processor core
    Ben A. Abderazek; Tsutomu Yoshinaga; Masahiro Sowa
    JOURNAL OF SUPERCOMPUTING, SPRINGER, 38, 1, 3, 15, 2006年10月, 査読付, 10.1007/s11227-006-6719-5, Emerging high-level hardware description and synthesis technologies in conjunction with field programmable gate arrays (FPGAs) have significantly lowered the threshold for hardware development. Opportunities exist to integrate these technologies into a tool for exploring and evaluating microarchitectural designs especially for newly proposed architectures. This paper presents a prototyping of a new processor core based on Queue architecture as starting point for application-specific processor design exploration. Using a hardware description language, we have created the Synthesizable model of a produced order parallel queue processor core for the integer subset parallel Queue architecture. A prototype implementation is produced by synthesizing the high-level model for the Stratix FPGA prototyping board. We show how to perform prototyping and optimizations to fully exploit the capabilities of the prototyped Queue processor core, while maintaining a common source base.
    研究論文(学術雑誌), 英語
  • Improving Linpack Performance on SMP Clusters with Asynchronous MPI Programming
    Ta Quoc Viet; Tsutomu Yoshinaga
    IPSJ Trans. ACS, 一般社団法人情報処理学会, 47, SIG 12 (ACS 15), 340, 348, 2006年09月, 査読付, This study proposes asynchronous MPI a simple and effective parallel programming model for SMP clusters to reimplement the High PerformanceLinpack benchmark. The proposed model forces processors of an SMP node to work in different phases thereby avoiding unneccessary communication and computation bottlenecks. As a result we can achieve significant improvements in performance with a minimal programming effort. In comparison with a de-facto flat MPI solution our algorithm can yield a 20.6% performance improvement for a 16-node cluster of Xeon dual-processor SMPs.This study proposes asynchronous MPI, a simple and effective parallel programming model for SMP clusters, to reimplement the High PerformanceLinpack benchmark. The proposed model forces processors of an SMP node to work in different phases, thereby avoiding unneccessary communication and computation bottlenecks. As a result, we can achieve significant improvements in performance with a minimal programming effort. In comparison with a de-facto flat MPI solution, our algorithm can yield a 20.6% performance improvement for a 16-node cluster of Xeon dual-processor SMPs.
    研究論文(学術雑誌), 英語
  • Predictive switching in 2-D torus routers
    Tsutomu Yoshinaga; Shojiro Kamakura; Michihiro Koibuchi
    INTERNATIONAL WORKSHOP ON INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 65, 72, 2006年, This paper proposes predictive switching in 2-D torus routers to reduce the number of pipeline stages for low-latency communication. By utilizing the communication regularity in parallel applications, a dynamic predicting mechanism presets packet traversal paths inside the router before packet arrivals. Hence, we can bypass the pipeline stages of routing computation, virtual channel allocation and switch allocation when the prediction hits. We considered the predictor architecture and accuracy for several traffic patterns in NAS parallel benchmarks. Our experiments show that a sampled pattern matching (SPM) predictor achieves 77% to 96% of the prediction hit rates when we use the dimension-order routing algorithm. We also discuss a method to improve the prediction accuracy of SPM by examining the frequency of occurrence for the prediction values in the communication history.
    研究論文(国際会議プロシーディングス), 英語
  • A partial irregular-network routing on faulty k-ary n-cubes
    Michihiro Koibuchi; Tsutomu Yoshinaga; Yasuhiko Nishimura
    INTERNATIONAL WORKSHOP ON INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 57, 64, 2006年, Interconnection networks have been studied to connect a number of processing elements on parallel computers. Their design increasingly includes a challenge to high fault-tolerance, as entire systems become complicated. This paper presents a partial irregular-network routing in order to provide a high fault-tolerance in k-ary n-cube networks. Since an irregular-network routing usually performs poorly in k-ary n-cube networks, it is only used for progressive deadlock-recovery, and avoiding hard failures. The network is logically divided into the fault and regular regions. In the regular region, most packets are transferred along fully adaptive paths that are computed, assuming that there are no hard failures, so as to uniformly distribute the traffic. Simulation results show that the proposed routing achieves the same throughput as that of Duato's protocol under no hard failures. As the number of faulty links increases to up to 8 on 256 nodes, its throughput is only decreased by 15%. Moreover the throughput of the proposed deadlock recovery routing is almost maintained during a dynamic reconfiguration.
    研究論文(国際会議プロシーディングス), 英語
  • Scalable core-based methodology and synthesizable core for systematic design environment in multicore SoC (MCSoC)
    Ben A. Abderazek; Tsutomu Yoshinaga; Masahiro Sowa
    2006 INTERNATIONAL CONFERENCE ON PARALLEL PROCESSING WORKSHOPS, PROCEEDINGS, IEEE COMPUTER SOC, 345, +, 2006年, 査読付, The strong demand for complex and high performance embedded system-on-chip requires quick turn around design methodology and high performance cores. Thus, there is a clear need for new methodologies supporting efficient and fast design of these systems on complex platforms implementing both hardware and software modules.
    In this paper, we describe a novel scalable core-based methodology for systematic design environment of application specific heterogeneous multicore systems-on-chip (MC-SoC). We also developed a high performance 32-bit Synthesizable QueueCore (QC-2) with single precision floating point support. The core is targeted for special purpose applications within our target MCSoC system. We present the architecture description and design results in a fair amount of details.
    研究論文(国際会議プロシーディングス), 英語
  • Asynchronous Parallel Programming Model for SMP Clusters
    Ta Quoc Viet; Tsutomu Yoshinaga
    Proc. of the IASTED Int. Conf. on Parallel and Distributed Computing Systems (PDCS 2005), 466, 070, 6 pages in CD, 2005年11月, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Parallel queue processor architecture based on produced order computation model
    M Sowa; BA Abderazek; T Yoshinaga
    JOURNAL OF SUPERCOMPUTING, SPRINGER, 32, 3, 217, 229, 2005年06月, 査読付, This paper proposes novel produced order parallel queue processor architecture. To store intermediate results, the proposed system uses a first-in-first-out (FIFO) circular queue-registers instead of random access registers. Datum is inserted in the queue-registers in produced order scheme and can be reused. We show that this feature has profound implications in the areas of parallel execution, programs compactness, hardware simplicity and high execution speed.
    Our performance evaluations show a significant performance improvement (e.g., 10 to 26% decrease in program size and 6 to 46% decrease in execution time over a range of benchmark programs) when compared with the earlier proposed architecture.
    研究論文(学術雑誌), 英語
  • Construction of Hybrid MPI-OpenMP Solutions for SMP Clusters
    Ta Quoc Viet; Tsutomu Yoshinaga; Ben A. Abderazek; Masahiro Sowa
    Transactions on Advanced Computing Systems, 一般社団法人情報処理学会, 46, ACS8, 25, 37, 2005年01月, 査読付, This paper proposes a middle-grain approach to construct hybrid MPI-OpenMP solutions for SMP clusters from an existing MPI algorithm. Experiments on different cluster platforms show that our solutions exceed the solutions that are based on the de-facto MPI model in most cases and occasionally by as much as 40% of performance. We also prove an automatic outperformance of a thread-to-thread communication model over a traditional process-toprocess communication model in hybrid solutions. In addition the paper performs a detailed analysis on the hardware and software factors affecting the performance of MPI in comparison to hybrid models.This paper proposes a middle-grain approach to construct hybrid MPI-OpenMP solutions for SMP clusters from an existing MPI algorithm. Experiments on different cluster platforms show that our solutions exceed the solutions that are based on the de-facto MPI model in most cases, and occasionally by as much as 40% of performance. We also prove an automatic outperformance of a thread-to-thread communication model over a traditional process-toprocess communication model in hybrid solutions. In addition, the paper performs a detailed analysis on the hardware and software factors affecting the performance of MPI in comparison to hybrid models.
    英語
  • Modular design structure and high-level prototyping for novel embedded processor core
    BA Abderazek; S Kawata; T Yoshinaga; M Sowa
    EMBEDDED AND UBIQUITOUS COMPUTING - EUC 2005, SPRINGER-VERLAG BERLIN, 3824, 340, 349, 2005年, 査読付, In this research work, we present a high-level prototyping of a new processor core based on Queue architecture as starting point for application-specific processor design exploration. Using modular design structure with control logic implemented as a set of communicating state machines, we show hardware emulation and optimizations results of a parallel queue proecssor architecture (QueueCore). We also show how to to fully exploit the capabilities of the designed QueueCore, while maintaining a common source base. From the evaluation results, we show that the QueueCore prototype fits on a single conventional FPGA device, thereby obviating the need to perform multi-chip partitioning which results in a loss of resource efficiency.
    研究論文(学術雑誌), 英語
  • Performance evaluation of dynamic network reconfiguration using Detour-UD routing
    T Yoshinaga; Y Nishimura
    INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 110, 118, 2005年, Fault-tolerance is an emerging issue for massively parallel computers. This paper describes the performance impact of dynamic network reconfiguration protocols using a fault-tolerant, adaptive deadlock-recovery routing algorithm, Detour-UD, for k-ary n-cubes. We propose a scheme to specify unroutable packets by managing drain-flags in routing tables. We also propose two selective drainage protocols. One protocol drains the unroutable packets specified by the drain-flags after the reconfiguration process. The other protocol drains deadlocked packets to reduce the network load during the reconfiguration process. Our simulation results show that the first protocol helps reduce the number of drainage packets, and the second one keeps the network throughput during the reconfiguration process.
    研究論文(国際会議プロシーディングス), 英語
  • 耐故障性を考慮した k-ary n-cube 用デッドロック回復ルーティング
    吉永努; 細越洋行; 曽和将容
    情報処理学会ACS論文誌, 情報処理学会, 45, SIG 11(ACS7), 408, 419, 2004年10月, 査読付
    研究論文(学術雑誌), 日本語
  • High Performance Hybrid Processor Architecture with Efficient Hardware Usability
    Akanda Md; Musfiquzzaman; Ben A. Abderazek; Soichi Shigeta; Tsutomu; Yoshinaga; Masahiro Sowa
    Proceedings on International Workshop on Modern Science and Technology, 43, 46, 2004年09月
    研究論文(国際会議プロシーディングス), 英語
  • Design of Producer-Order Parallel Queue Processor Architecture
    A. Markovskij; B.A. Abderazek; S. Shigeta; T. Yoshinaga; M. Sowa
    Proceedings on International Workshop on Modern Science and Technology, 25, 28, 2004年09月
    研究論文(国際会議プロシーディングス), 英語
  • QJava: Integrate Queue Computational Model into Java
    S. Shigeta; L.-Q. Wang; N. Yagishita; B. A. Abderazek; T. Yoshinaga; M. Sowa
    Proc. of the Joint Japan-Tunisia Workshop on Computer Systems and Information Technology (JT-CSIT'04), 60, 65, 2004年07月
    研究論文(国際会議プロシーディングス), 英語
  • Optimization for Hybrid MPI-OpenMP Programs on a Cluster of SMP PCs
    Tsutomu Yoshinaga; Ta Quoc Viet
    Proc. of the Joint Japan-Tunisia Workshop on Computer Systems and Information Technology (JT-CSIT'04), 28, 35, 2004年07月
    研究論文(国際会議プロシーディングス), 英語
  • Theoretical Evaluation of Simultaneous Multithreading Parallel Queue Processor Architecture
    Hirotoshi Sasaki; Yoshitomo Okumura; Ben Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
    International Conference on Circuits/Systems, Computers and Communications, 6D1L-2-1~4, 2004年07月
    研究論文(国際会議プロシーディングス), 英語
  • Fault-tolerant adaptive deadlock-recovery routing for k-ary n-cube networks
    T Yoshinaga; H Hosogoshi; M Sowa
    INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 49, 58, 2004年, 査読付, This paper proposes a fault-tolerant fully adaptive deadlock-recovery routing algorithm for k-ary n-cube networks. We intend to consider both the adaptability for faults and the communication performance by integrating regular and irregular network routing. Our algorithm tolerates any number or shape of faults without disabling fault-free nodes by maintaining routing tables that are configured based on faulty information. Our algorithm also provides minimal misrouting paths around faults by guaranteeing deadlock freedom using only two virtual channels per physical channel. Simulation results show that the proposed algorithm attains robust communication performance for uniform and nonuniform traffic patterns not only on a fault-free torus network but also on irregular tori with faulty nodes.
    研究論文(国際会議プロシーディングス), 英語
  • Queue processor architecture for novel queue computing paradigm based on produced order scheme
    BA Abderazek; M Arsenji; S Shigeta; T Yoshinaga; M Sowa
    SEVENTH INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING AND GRID IN ASIA PACIFIC REGION, PROCEEDINGS, IEEE COMPUTER SOC, 169, 177, 2004年, 査読付, This paper proposes novel produced order parallel queue processor architecture. To store intermediate results, the proposed system uses a FIFO queue registers instead of random access registers. Datum is inserted in the queue in produced order scheme and can be reused. We will show that this feature has a profound implication in the areas of parallel execution, programs compactness, hardware simplicity and high execution speed. Our preliminary performance evaluations have shown a significant performance improvement (e.g., 10% to 26% decrease in program size and 6% to 46% decrease in execution time over a range of benchmark programs) when compared with the earlier proposed architecture.
    研究論文(国際会議プロシーディングス), 英語
  • QJAVAC: Queue-Java Compiler Design for High Parallelism Queue Java Bytecode
    Li. Qiang Wang; Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
    International Conference on Circuits/Systems, Computers and Communications (ITC-CSCC2003), 900, 903, 2003年07月, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Architectural Issues in the Design of a High Performance Parallel Queue Processor
    Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
    4th Bilateral Symposium on Science & Technology, 2003年04月
    研究論文(国際会議プロシーディングス), 英語
  • Design and evaluation of a fault-tolerant adaptive router for parallel computers
    T Yoshinaga; H Hosogoshi; M Sowa
    INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 100, 107, 2003年, In this paper, we propose a design methodology for fault tolerant adaptive routers for parallel and distributed computers. The key idea of our method is integrating minimal and non-minimal routing that is supported by independent virtual channels (VCs). Distinguishing the routing functions for each set of VCs simplifies the design of fault-tolerant algorithms. After describing the method, we show an application of a routing algorithm for two-dimensional mesh and torus networks. This algorithm, called Detour-NF, supports three routing modes: deterministic, minimal fully adaptive and non-minimal fault-tolerant operations. We also discuss the hardware cost and operational speed of minimal and non-minimal routers based on our design, which uses hardware description language (HDL).
    Communication performance and fault-tolerance are demonstrated by an HDL simulation. The experimental results show that supporting both minimal and non-minimal routing modes is advantageous for high-bandwidth and low-latency communication, as well as fault-tolerance.
    研究論文(国際会議プロシーディングス), 英語
  • On the design of a register queue based processor architecture (FaRM-rq)
    BA Abderazek; S Shigeta; T Yoshinaga; M Sowa
    PARALLEL AND DISTRIBUTED PROCESSING AND APPLICATIONS, PROCEEDINGS, SPRINGER-VERLAG BERLIN, 2745, 248, 262, 2003年, 査読付, We propose in this paper a processor architecture that supports multi instructions set through run time functional assignment algorithm (RUNFA). The above processor, which is named Functional Assignment Register Microprocessor (FaRM-rq) supports queue and register based instruction set architecture and functions into different modes: (1) R-mode (FRM) - when switched for register based instructions support, and (2) Q-mode (FQM) - when switched for Queue based instructions support. The entities share a common data path and may operate independently though not in parallel.
    In FRM mode, the machine's shared storage unit (SSU) behaves as a conventional register file. However, in FQM mode, the system organizes the SSU access as a first-in-first-out latches, thus accesses concentrate around a small window and the addressing of registers is implicit trough the Queue head and tail pointers.
    First, we present the novel aspects of the FaRM-rq(1) architecture. Then, we give the novel FQM fundamentals and the principles underlying the architecture.
    研究論文(学術雑誌), 英語
  • Proposal and Design of a Parallel Queue Processor Architecture (PQP)
    M. Sowa; B. A. Abderazek; S. Shigeta; K. Nikolova; T. Yoshinaga
    Proc. 14th IASTED International Conference on Parallel and Distributed Computing and Systems, 554, 560, 2002年10月, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Complexity Analysis of a Functional Assignment Register Microprocessor
    Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
    International Workshop on Modern Science and Technology (IWMST2002), 116, 123, 2002年09月
    研究論文(国際会議プロシーディングス), 英語
  • High parallelism Java Compiler with Queue Architecture
    Li-Qiang Wang; Tsutomu Yoshinaga; Masahiro Sowa
    International Workshop on Modern Science and Technology (IWMST02), 130, 135, 2002年09月
    研究論文(国際会議プロシーディングス), 英語
  • A scalable FPGA-based custom computing machine for a medical image processing
    T Yokota; M Nagafuchi; Y Mekada; T Yoshinaga; K Ootsu; T Baba
    10TH ANNUAL IEEE SYMPOSIUM ON FIELD-PROGRAMMABLE CUSTOM COMPUTING MACHINES, PROCEEDINGS, IEEE COMPUTER SOC, 307, 308, 2002年, Concentration index filter is a kind of spatial filters of images, and its typical application is diagnosis from medical images. This paper presents a dedicated computing engine for concentration index filtering. Original algorithm is modified to extract full parallelism and data width is optimized for maximizing clock speed and minimizing hardware scale. Evaluation results reveal that the system runs 100 times faster than current workstation and enables real-time diagnosis.
    研究論文(国際会議プロシーディングス), 英語
  • Real-time medical diagnosis on a multiple FPGA-based system
    T Yokota; M Nagafuchi; Y Mekada; T Yoshinaga; K Ootsu; T Baba
    FIELD-PROGRAMMABLE LOGIC AND APPLICATIONS, PROCEEDINGS, SPRINGER-VERLAG BERLIN, 2438, 1088, 1091, 2002年, 査読付, The concentration index is a novel characteristic measurement that indicates the degree of concentration of lines to a certain point. Its typical application is medical diagnosis; for example, gastric cancer has a distinctive nature that folds concentrate to the lesion. Its large computational complexity requires much computing time. This paper presents a multiple FPGA-based computing architecture which accelerates the concentration index calculation and enables real-time diagnosis of gastric cancer. Evaluation results reveal that gate- and pin- counts are within those of todays' FPGA devices, and that the diagnosis process should be accelerated about 100 times faster than ordinal workstations..
    研究論文(学術雑誌), 英語
  • 受信メッセージ予測法によるMPI受信処理の高速化
    岩本善行; 足立涼子; 大津金光; 吉永努; 馬場敬信
    情報処理学会論文誌, 情報処理学会, 42, 4, 812, 820, 2001年04月, 査読付
    研究論文(学術雑誌), 日本語
  • 仮想チャネル数と動作周波数を考慮した適応ルータの性能評価
    堀田真貴; 吉永努; 大津金光; 馬場敬信
    情報処理学会論文誌, 情報処理学会, 42, 4, 714, 723, 2001年04月, 査読付
    研究論文(学術雑誌), 日本語
  • Design and evaluation of speculative multithreading with selective multi-path execution
    K. Ootsu; T. Yoshinaga; T. Baba
    Proceedings - 15th International Parallel and Distributed Processing Symposium, IPDPS 2001, Institute of Electrical and Electronics Engineers Inc., 1409, 1416, 2001年, 査読付, 10.1109/IPDPS.2001.925123, Thread Level Parallelism (TLP) is the most promising way to the future high-performance microprocessors. When a sequential program code is speculatively executed in a multithreaded manner, it is natural that each speculative thread follows the control flow of the program. Based on this background, various studies have been performed on speculative multithreading, following control flow graph. This paper proposes a new execution model that aims at the speedup of the execution of usual sequential program codes by speculatively executing the multiple control flows in parallel. Further, this paper shows the thread control mechanism and the inter-thread communication facility required for the realization of the model. For the evaluation of our model, the cycle-based instruction-level simulator has been developed. We evaluate our model with simple benchmark programs and show the effectiveness of our model especially, for the case where the speculation by single control flow is difficult to speedup the programs.
    研究論文(国際会議プロシーディングス), 英語
  • 受信メッセージ予測方式の検討
    岩本善行; 大津金光; 吉永 努; 馬場敬信
    情報処理学会論文誌, 情報処理学会, 41, 09, 2582, 2591, 2000年09月, 査読付
    研究論文(学術雑誌), 日本語
  • Performance Evaluation of the Recover-X Adaptive Router for 2D Torus Networks
    T. Yoshinaga; M. Hayashi; M. Horita; S. Nakamura; K. Ootsu; T. Baba
    Proceedings of the World Multiconference on Systemics, Cybernetics and Informatics 2000, 4, 107, 112, 2000年08月, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • Recover-X適応ルーティング
    吉永 努; 林 匡哉; 堀田真貴; 中村さゆり; 大津金光; 馬場敬信
    情報処理学会論文誌, 情報処理学会, 41, 5, 1360, 1369, 2000年05月, 査読付
    研究論文(学術雑誌), 日本語
  • Design, Implementation and Evaluation of a Parallel Object-Oriented Language A-NETL
    Takanobu Baba; Tsutomu Yoshinaga; Yoshiyuki Iwamoto; Kanemitsu Ootsu
    Parallel and Distributed Computing Practices, 3, 2, 199, 219, 2000年, 査読付
    研究論文(学術雑誌), 英語
  • Efficient Implementation of a Parallel Object-Oriented Language A-NETL on Multicomputers
    Takanobu Baba; Tsutomu Yoshinaga; Yoshiyuki Iwamoto; Somchai Numprasertchai; Norihito Saitoh; Kanemitsu Ootsu; Mitsutoshi Hori
    Proc. France-Japan Workshop on Object-Based Parallel and Distributed Computation, Object-Oriented Parallel and Distributed Programming, 75, 93, 2000年
    研究論文(国際会議プロシーディングス), 英語
  • Recover-x: An adaptive router with limited escape channels
    T Yoshinaga; M Hayashi; M Horita; S Nakamura; K Ootsu; T Baba
    SEVENTH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 272, 279, 2000年, 査読付, In order to improve network performance, a variety of adaptive routing algorithms has been proposed. Recent research focuses oil their implementation costs, as well as the performance to enhance their practical applications. This paper proposes the Recover-x adaptive routing, which limits escape message candidates in a blocked or deadlocked configuration. This limitation simplifies the routing logic and offers a chance to balance the usage between adaptive and non-adaptive channels.
    The cost and performance of four wormhole routers based on Verilog-HDL designs were compared. Synthesis results for the chosen gate at-ray technology show that the Recover-x router attains a fast operating speed and low-latency, with high-bandwidth communication performance.
    研究論文(国際会議プロシーディングス), 英語
  • 並列オブジェクト指向言語A-NETLの実現とその評価
    馬場敬信; 吉永努; 岩本善行; 斎藤宣人; S. Numprasertchai
    情報処理学会論文誌, 情報処理学会, 40, 9, 3554, 3563, 1999年, 査読付
    研究論文(学術雑誌), 日本語
  • Message Prediction and Speculative Execution of the Reception Process
    Y. Iwamoto; K. Ootsu; T. Yoshinaga; T. Baba
    Proc. IASTED International Conference on Parallel and Distributed Computing and Systems '99, 329, 334, 1999年, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • A-NET マルチコンピュータにおける仮想時間を用いた性能評価法とその実現
    岩本善行; 阿部大輝; 大津金光; 吉永努; 馬場敬信
    情報処理学会論文誌, 情報処理学会, 40, 5, 1947, 1957, 1999年, 査読付
    研究論文(学術雑誌), 日本語
  • A Parallel Navigation Algorithm with Dynamic Load Balancing for OODBMSs
    L. Mutenda; T. Baba; T. Yoshinaga; K. Ootsu
    Trans. on IPSJ Database Systems, 40, SIG5(TOD2), 29, 42, 1999年, 査読付
    研究論文(学術雑誌), 英語
  • A speculative multithreading with selective multi-path execution
    K Ootsu; W Yoshinari; F Furukawa; T Yoshinaga; T Baba
    INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, IEEE COMPUTER SOC, 46, 52, 1999年, 査読付, Recent microprocessors' performance has been improved by their high-speed clock frequency and by their exploiting instruction-level parallelism (ILP). Physical limitations of clock speed and semantical limitations of control dependencies impede the improvement of performance. To overcome this difficulty, it is indispensable to make use of the thread-level parallelism. This paper proposes a speculative thread execution model that aims at a speed-up of sequential program execution by selective multi-path thread execution.
    研究論文(国際会議プロシーディングス), 英語
  • 適応ルータの出力チャネル選択における優先次元指定の効果
    吉永努; 林匡哉; 堀田真貴; 山口喜教; 大津金光; 馬場敬信
    情報処理学会 論文誌, 情報処理学会, 40, 5, 1958, 1967, 1999年, 査読付, 本論文では メッセージごとに適応ルーティング時に優先する出力チャネルやFIFO性保証のための適応ルーティングの禁止を指定可能なルーティングを提案する. また そのハードウェアコストと性能をハードウェア記述言語により設計したルータの論理合成とシミュレーションによって評価する. その結果 優先次元指定ルーティングは (1)バーチャルチャネルの追加と比較して 小さなコストでサポートできる (2)ホットスポットを形成する通信パターンのスループットを大きく改善する (3)適応性が制限可能であることは FIFO性の保証のみでなく ユニフォーム通信におけるネットワークの負荷を均等に保つことに対しても有効活用できる などを明らかにした.We propose a new adaptive routing method which is capable of selecting, based on a prioritizing system, a particular dimension to output each message. We have compared its hardware cost and performance based on HDL designs. The results of HDL synthesis and simulation lead to the following conclusions: (1) The dimension-selective routing can be sup-ported inexpensively compared with adding virtual channels; (2) Adaptive routers which support communication scheduling are effective in improving network performance; (3) The ability to restrict adaptive routing is useful not only in maintaining in-order message delivery but also balancing the overall network load for uniform communication traffic.
    研究論文(学術雑誌), 日本語
  • The A-NET working prototype: A parallel object-oriented multicomputer with reconfigurable network
    T Baba; T Yoshinaga; Y Iwamoto; D Abe
    INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 40, 49, 1998年, A multicomputer prototype has been co-designed and implemented in conjunction with a programming language, A-NETL, based on a parallel object-oriented computation model. Each node processor consists of a processing element and a router. The prototype PE has an A-NETL directed, high-level instruction set. The implementation is supported by firmware and hardware. The router has been designed to be independent of network topology, utilizing virtual-cut-through, adaptive routing.
    Experimental results show that a round trip for a, 35-byte message between adjacent nodes takes 85 machine cycles (MCs), and 6 MCs per hop; adaptive routing attains low latency communication under contention; the adaptation of network topology to a given communication pattern shows better performance than a generic topology; and the application to small problems attains a 10 to 18 times speedup on the 16-node prototype.
    研究論文(国際会議プロシーディングス), 英語
  • A-NETマルチコンピュータのシステム性能評価
    吉永努; 澤田東; 廣田守; 阿部大輝; 岩本善行; 馬場敬信
    電子情報通信学会 論文誌, 電子情報通信学会, J81-D-I, 4, 368, 376, 1998年, 査読付, A-NETマルチコンピュータは, 並列オブジェクト指向言語A-NETLの設計と共に, トータルアーキテクチャの一環として開発した分散メモリ型並列計算機である.16ノードプロトタイプを使用した実験から, 通信性能は, 35バイトの隣接メッセージ転送に対して往復85マシンサイクル, 1ホップ当りの遅延時間は6マシンサイクルであることがわかった.また, 衝突による通信遅延は, PEの処理速度に対して十分高速であり, 適応型ルーチングの効果を確認した.更に, メッセージのオーバヘッドを変化させたA-NETLプログラムの実行結果から, 通信処理や並列アルゴリズムが実行性能に与える影響について考察した.実験したプログラムでは, 16ノードで約9.6〜18倍の台数効果が得られた.
    研究論文(学術雑誌), 日本語
  • メッセージ転送処理の高速化法とその評価
    岩本善行; 澤田東; 阿部大輝; 澤田康雄; 大津金光; 吉永努; 馬場敬信
    情報処理学会論文誌, 情報処理学会, 39, 6, 1663, 1671, 1998年
    研究論文(学術雑誌), 日本語
  • A cost and performance comparison for wormhole routers based on HDL designs
    T Yoshinaga; M Hayashi; M Horita; Y Yamaguchi; K Ootsu; T Baba
    1998 INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS, PROCEEDINGS, IEEE COMPUTER SOC, 375, 382, 1998年, 査読付, Our research investigates cost and performance characteristics for wormhole routers based on HDL designs. Comparison for dimension-order routers and turn model-based adaptive routers leads to the following conclusions: (1) Static and additional routing information which we propose in this paper, such as prior dimension specification and in-order delivery, improves the communication performance.(2) An adaptive routing algorithm must be implemented to satisfy the objective speed of the design. The operation speed of the routers affects the network; performance a lot. (3) The virtual channels cancel the improvement not only for the dimension-order router but also for the naive implementation of the adaptive routers when they degrade the operation speed.
    研究論文(国際会議プロシーディングス), 英語
  • Parallel navigation in an A-NETL based parallel OODBMS
    Lawrence Mutenda; Manabu Hiyama; Tsutomu Yoshinaga; Takanobu Baba
    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), Springer Verlag, 1336, 305, 316, 1997年, 査読付, 10.1007/BFb0024225, A parallel OODBMS has been proposed based on a parallel object-oriented language, A-NETL. The OODBMS is designed for a shared-nothing environment. An overview of the database system is described. Accessing object-data in a parallel OODBMS is based on navigation. A parallel navigation algorithm being implemented for use in the system is presented including its features. The algorithm is based on the need to balance the load across all nodes in a parallel OODB accessing objects with set-valued attributes. An analytical evaluation of the features of the algorithm is prescnted.
    研究論文(国際会議プロシーディングス), 英語
  • 並列オブジェクト指向言語A-NETLの高並列計算機への実装
    吉永努; 馬場敬信; S. Numprasertchai
    電子情報通信学会論文誌, 電子情報通信学会, J80-D-I, 9, 787, 790, 1997年, 実行性能と移植性を考慮した, 並列オブジェクト指向言語の高並列計算機への実装と評価について報告する. コンパイラが, 受信メッセージのハンドラやメソッドディスパッチャのコードを自動生成することにより, 高機能なメッセージインタフェースやアクティブオブジェクトをサポート可能である. コンパイル時の最適化により, ターゲットマシンのC言語プログラムに近い性能でメッセージパッシングできることが分かった. また, サンプルプログラムを用いて, 並列処理による台数効果を確認した.
    研究論文(学術雑誌), 日本語
  • 並列オブジェクト指向言語A-NETLのイベントベースデバッギング システム
    馬場敬信; 古谷泰重; 吉永努
    信学論 (D-I), 電子情報通信学会, J79-D-I, 6, 331, 340, 1996年06月, 査読付
    研究論文(学術雑誌), 日本語
  • 並列オブジェクト指向トータルアーキテクチャA-NETのノードプロセッサ
    吉永努; 馬場敬信
    電子情報通信学会 論文誌, 電子情報通信学会, J79-D-I, 2, 60, 68, 1996年, 査読付, 並列オブジェクト指向計算モデルに基づく高並列計算機のノードプロセッサを計算し, プロトタイプを試作した。このノードプロセッサは, メソッドを実行するPEと, メッセージの送受信を行うルータからなる. PEは, メッセージ送受信命令などの高機能命令セットを命令前処理ユニット(IPU)でデコードし, マイクロプログラムで実行する. また, 同期機構や動的データ型付けなどをサポートするためのタグ付きアーキテクチャを採用し, これをタグ処理ユニット(TPU)によりハードウェア支援する. TPUの効果を加算命令を例に調べた結果, TPUを使用しない場合より実行時間(マイクロステップ数)が約44%高速化できることがわかった. また, IPUを使用しないと3倍程度の実行ステップ数が必要となる. プロトタイプを30MHzで動作させてメッセージの転送時間を実測した結果, 35Byteのメッセージを隣接ノードに転送するのに約5.2μs, 1ホップ当りの遅延時間が約1.0μsであることが確認できた.
    研究論文(学術雑誌), 日本語
  • A DECLARATIVE SYNCHRONIZATION MECHANISM FOR PARALLEL OBJECT-ORIENTED COMPUTATION
    T BABA; N SAITOH; T FURUTA; H TAGUCHI; T YOSHINAGA
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRON INFO COMMUN ENG, E78D, 8, 969, 981, 1995年08月, We have designed and implemented a simple yet powerful declarative synchronization mechanism for a parallel object-oriented computation model. The mechanism allows the user to control multiple message reception, specify the order of message reception, lock an invocation, and specify relations as invocation constraints. It has been included in a parallel object-oriented language, called A-NETL. The compiler and operating system have been developed on a total architecture, A-NET (Actors NETwork). The experimental results show that (i) the mechanism allows the user to model asynchronous events naturally, without losing the integrity of described programs; (ii) the replacement of the mechanism with the user's code requires tedious descriptions, but gains little performance enhancement, and certainly loses program readability and integrity; (iii) the mechanism allows the user to shift synchronous programs to asynchronous ones, with a scalable reduction of execution times: an average 20.6% for 6 to 17 objects and 46.1% for 65 objects. These prove the effectiveness of the proposed synchronization mechanism.
    研究論文(学術雑誌), 英語
  • Programming and Debugging for Massive Parallelism: The Case for a Parallel Object-Oriented Language A-NETL
    Takanobu Baba; Tsutomu Yoshinaga; Takahiro Furuta
    Proc. Workshop on Object-Based Parallel and Distributed Computation, Springer, Lecture Notes in Computer Science 1107, Springer-Verlag, 38, 58, 1995年
    研究論文(国際会議プロシーディングス), 英語
  • A-NETL: A Language for Massively Parallel Object-Oriented Computing
    Takanobu Baba; Tsutomu Yoshinaga
    Proc. Massively Parallel Programming Models, 98, 105, 1995年, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • トポロジカルなプログラミングが可能な並列オブジェクト指向言語A-NETL
    吉永努; 馬場敬信
    電子情報通信学会 論文誌, 電子情報通信学会, J77-D-I, 8, 557, 566, 1994年, 査読付, A-NETLは,並列オブジェクト指向トータルアーキテクチャA-NETプロジェクトにおいて設計された高並列プログラミング言語であり,(1)静的な多数オブジェクトの定義を可能とするインデックストオブジェクト,(2)ノード指定可能な動的オブジェクト生成,(3)メッセージのマルチキャストとマルチレシーブ,(4)メソッドの実行順序制御などに特徴がある.インデックストオブジェクトは,体系的にオブジェクトグループを扱うのに有効である.グループに属する一連のオブジェクトの起動と処理の待合せについては,メッセージの並列送受信構文を用いて簡便に記述できる.また,動的に構造が変化する問題に対しては,割付けノードを指定した動的オブジェクト生成を使用できる.ユーザは,これらの機能を利用することにより,問題固有の並列性をネットワークトポロジーに反映したプログラミングが可能となる.更に,個々のオブジェクト間の通信関係を反映したオブジェクト間関係宣言を用いることにより,非定型的な問題も容易に扱うことができる.オブジェクトの内部状態の保護とメッセージのディスパッチについては,メソッドの実行順序制御と起動条件に関する制御構文を与えることにより,オブジェクトの自律的な動作を可能とする.
    研究論文(学術雑誌), 日本語
  • 並列オブジェクト指向トータルアーキテクチャA-NETのためのトポロジ独立なルータの構成
    吉永努; 馬場敬信
    情報処理学会論文誌, 一般社団法人情報処理学会, 34, 4, 648, 657, 1993年04月, 査読付, 並列オブジェクト指向実行モデルに基づくA?NET高並列計算機のルータを設計した。A-NETルータは、静的に可変な種々のネットワークトポロジをサポートするため、プログラマブル通信制御装置を用いてメッセージの経路選択を行う。メッセージは、適応型バーチャルカットスルー方式による可変長パケット交換により実現する。また、ユーザ定義のオブジェクトやメソッドを動的にノード間転送するために、サーキットスイッチ方式のデータ転送もサポートする。ルータは、ホスト用に1ポート、および隣接ルータとの接続用に6ポートを梼ち、PEインタフェース回路、メッセージセンダ/レシーバ、パケット退避用バッファなどをクロスバ網で接続した構成をとる。これらクロスバ網に接続した各ブロックは、パケットやオブジェクトコードなどの転送主体となり、パケットの経路選択、およびクロスバ網の設定はプログラマブル通信制御装置が行う。各ブロックは、それぞれステートマシンを内蔵して独立に動作し、ルータ内で並列にデータ転送が行える。通信性能を評価した結果、無衝突時のパケットの1ホップ当りの経路選択時間は、約2usで、平均的なサイズのパケットの転送時間は10?48us程度(距離1?20)であることが分かった。この値は、PE上での1メッセージ当りのユーザプログラムの連続実行時間とバランスの取れたものといえる。
    研究論文(学術雑誌), 日本語
  • 並列オブジェクト指向トータルアーキテクチャA-NETにおける 言語とアーキテクチャの統合
    馬場敬信; 吉永努
    信学論, 電子情報通信学会, J75-D-I, 8, 563, 574, 1992年08月
    研究論文(学術雑誌), 日本語
  • A Local Operating System for the A-NET Parallel Object-Oriented Computer
    Tsutomu Yoshinaga; Takanobu Baba
    Journal of Information Processing, 14, 4, 414, 422, 1992年04月, 査読付
    研究論文(学術雑誌), 英語
  • A PARALLEL OBJECT-ORIENTED LANGUAGE A-NETL AND ITS PROGRAMMING ENVIRONMENT
    T YOSHINAGA; T BABA
    COMPSAC 91 - THE FIFTEENTH ANNUAL INTERNATIONAL COMPUTER SOFTWARE & APPLICATIONS CONFERENCE, PROCEEDINGS, I E E E, COMPUTER SOC PRESS, 459, 464, 1991年, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • MUNAP上の拡張L6言語を用いた3次元色彩図形処理
    馬場敬信; 加賀谷学; 吉永努; 鈴木伸二; 山崎勝弘; 奥田健三
    信学論, 電子情報通信学会, J73-D-I, 1, 9, 17, 1990年01月, 査読付
    研究論文(学術雑誌), 日本語
  • A NETWORK-TOPOLOGY INDEPENDENT TASK ALLOCATION STRATEGY FOR PARALLEL COMPUTERS
    T BABA; Y IWAMOTO; T YOSHINAGA
    SUPERCOMPUTING 90, I E E E, COMPUTER SOC PRESS, 878, 887, 1990年, 査読付
    研究論文(国際会議プロシーディングス), 英語
  • A PARALLEL OBJECT-ORIENTED TOTAL ARCHITECTURE - A-NET
    T BABA; T YOSHINAGA; T IIJIMA; Y IWAMOTO; M HAMADA; M SUZUKI
    SUPERCOMPUTING 90, I E E E, COMPUTER SOC PRESS, 276, 285, 1990年, 査読付
    研究論文(国際会議プロシーディングス), 英語

MISC

  • チャンク分割コンテンツ配置を用いた分散協調色キャッシュ (コンピュータシステム)
    岡田 浩希; 城間 隆行; 中島 拓真; 策力木格; 吉永 努
    電子情報通信学会, 2017年11月19日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 314, 3, 8, 日本語, 0913-5685, 40021402233, AN10013141
  • 色タグ情報に基づく分散協調キャッシュおよびチャンク分割キャッシュ制御のプロトタイプの実装 (コンピュータシステム)
    中島 拓真; 岡田 浩希; 策力木格; 吉永 努
    電子情報通信学会, 2017年11月19日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 314, 9, 14, 日本語, 0913-5685, 40021402258, AN10013141
  • Performance evaluation of RPL-based sensor data collection in challenging IoT environment (コミュニケーションクオリティ)
    Gao Liming; Wu Celimuge; Yoshinaga Tsutomu
    電子情報通信学会, 2017年01月19日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 403, 7, 12, 英語, 0913-5685, 40021101994, AN1054106X
  • Reinforcement Learning-based Data Storage Scheme in Vehicular Ad Hoc Networks
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji; Tutomu Murase; Yan Zhang
    IEEE, 2016年05月24日, Proc. of the IEEE International Conference on Communications (ICC) 2016, 718, 723, 英語, 査読付, 会議報告等
  • 動画の人気変動に追従する異種キャッシュ混在ネットワークの検討 (コンピュータシステム) -- (組込み技術とネットワークに関するワークショップETNET2016)
    中島 拓真; 城間 隆行; 吉見 真聡; 策力木格; 吉永 努
    電子情報通信学会, 2016年03月24日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 115, 518, 247, 252, 日本語, 0913-5685, 40020791009, AN10013141
  • Design and Evaluation of Low-Latency Handshake Join on FPGA (コンピュータシステム) -- (組込み技術とネットワークに関するワークショップETNET2016)
    YOSHIMI Masato; OGE Yasin; WU Celimuge; YOSHINAGA Tsutomu
    電子情報通信学会, 2016年03月24日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 115, 518, 253, 258, 英語, 0913-5685, 40020791018, AN10013141
  • 活動60年を超えたコンピュータシステム研究会
    吉永努
    電子情報通信学会, 2014年05月01日, 電子情報通信学会情報・システムソサイエティ誌, 19, 1, 10, 11, 日本語, 招待, その他, 10.1587/ieiceissjournal.19.1_10, 130005433624

書籍等出版物

  • ロス・キニー論理回路
    佐藤証; 三輪忍; 吉永努
    教科書・概説・概論, 日本語, 共訳, 1~5章, 東京化学同人, 2021年05月20日
  • The Massively Parallel Processing System JUMP-1
    Takanobu Baba; Tsutomu Yoshinaga
    英語, 共著, Ohmsha, 1996年

講演・口頭発表等

  • モバイル分散協調キャッシュにおけるマルチホップD2D通信の活用
    宮原雅司; 秋場大暉; 萩原賢; 策力木格; 吉永努
    口頭発表(一般), 日本語, 信学技報, vol. 122, no. 451, CPSY2022-37, pp. 19-24,
    2023年03月23日
  • モバイル分散協調キャッシュにおけるユーザQoE向上のためのコンテンツ配置手法
    秋場大暉; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会,信学技報, IEICE-CPSY2022-7, 電子情報通信学会, 下関, 国内会議
    2022年07月28日
  • A UAV-empowered Routing Protocol for Federated Learning in Delay Tolerant Environments
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
    口頭発表(一般), 英語, IEICE Technical Report, CQ2021-55, 国内会議
    2021年09月
  • Load balancing method using reinforcement learning between edge and cloud
    Hiroki Kobari; Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
    口頭発表(一般), 英語, IEICE Technical Report, CQ2021-38, IEICE, 国内会議
    2021年09月
  • FPGAを用いたデータベースクエリ処理の高速化
    尾作洋彦; 吉見真聡; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会/信学技報CPSY2020-38, 電子情報通信学会, オンライン, 国内会議
    2021年01月26日
  • 分散協調キャッシュサーバ処理のFPGAオフロード
    山岸徹平; 吉見真聡; 策力木格; 吉永 努
    口頭発表(一般), 日本語, SWoPP2020/CPSY2020-10, 電子情報通信学会, オンライン, 国内会議
    2020年07月31日
  • 視覚数理モデルシミュレーションの高速化と錯視画像の探索
    柳田悠介; 佐藤俊治; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会,信学技法,ニューロコンピューティング研究会, 電子情報通信学会, 東京, 国内会議
    2020年03月04日
  • モバイル分散・協調キャッシュにおける事前プッシュ配信による通信量削減
    城間隆行; 吉見真聡; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会 信学技法 コンピュータシステム研究会, 国内会議
    2020年02月27日
  • FPGAを用いたストリームデータ集約演算のウィンドウサイズ拡大
    大坂誠樹; 吉見真聡; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会,CPSY研究会/信学技法 CPSY2020-01, 電子情報通信学会, 日吉, 国内会議
    2020年01月23日
  • Empowering ICN in Intermittent Connectivity Scenarios
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga
    口頭発表(一般), 英語, IEICE Society Conference 2019, IEICE, 国内会議
    2019年09月
  • モバイル分散協調キャッシュにおけるコンテンツ配置のテンプレート化
    城間隆行; 策力木格; 吉永努
    口頭発表(一般), 日本語, 信学技法,CPSY2019-38, 電子情報通信学会, 北見市, 国内会議
    2019年07月26日
  • A VDTN Routing Protocol with Enhanced Buffer Management Policy
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE General Conference 2019, IEICE, 国内会議
    2019年03月
  • A Vehicular DTN Routing Protocol with Enhanced Buffer Management Policy
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Technical Report, CQ2018-81, IEICE, 国内会議
    2019年01月
  • マルチノードFPGAを用いた低遅延ストリームデータ結合処理
    松下紘嗣; 策力木格; 吉永努
    口頭発表(一般), 日本語, 電子情報通信学会,信学技法,CPSY2018-17, 電子情報通信学会, 熊本, 国内会議
    2018年07月31日
  • A Prophet-based DTN protocol for VANETs
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Technical Report, CQ2018-24, 国内会議
    2018年05月
  • An Openflow-based Management Framework for Sensor and Actuator Networks
    Rui Kang; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Tech. Report, CQ2017-87, IEICE, Tokyo, 国内会議
    2018年01月18日
  • 相互結合ネットワークとその計算システムに関する研究
    吉永努
    口頭発表(招待・特別), 日本語, コンピュータシステム研究会/信学技法CPSY2017-115, 招待, 電子情報通信学会, 日吉, 国内会議
    2018年01月18日
  • Evaluation on performance gain of an SDN-based handover approach in IEEE 802.11p and LTE hybrid vehicular networks
    Ran Duo; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Tech. Report, CQ2017-86, IEICE, Tokyo, 国内会議
    2018年01月18日
  • チャンク分割コンテンツ配置を用いた分散協調色キャッシュ
    岡田浩希; 城間隆行; 中島拓真; 策力木格; 吉永努
    ポスター発表, 日本語, 電子情報通信学会/信学技法 CPSY2017-51, 電子情報通信学会, 国内会議
    2017年11月19日
  • 色タグ情報に基づく分散協調キャッシュおよびチャンク分割キャッシュ制御のプロトタイプの実装
    中島拓真; 岡田浩希; 策力木格; 吉永努
    ポスター発表, 日本語, 電子情報通信学会/信学技法 CPSY2017-52, 電子情報通信学会, 青森, 国内会議
    2017年11月19日
  • System Performance Assessment and Sizing for Cloud-based Data Backup
    Yuichi Taguchi; Tsutomu Yoshinaga
    口頭発表(一般), 英語, コンピュータシステム・シンポジウム (ComSys2017), 情報処理学会 システムソフトウェアとオペレーティング・システム研究会, 川崎市, 国内会議
    2017年11月07日
  • Performance Evaluation of Vehicular DTN Protocols for Anycast Vehicle-to-cloud Communications
    Zhaoyang Du; Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Technical Report, CQ2017-52, IEICE
    2017年08月
  • アクセス変動予測を用いた分散協調キャッシュ制御
    千田進; 城間隆行; 中島拓真; 策力木格; 吉永努
    口頭発表(一般), 日本語, 信学技法,CPSY2017-23, 国内会議
    2017年07月26日
  • Content Distribution in VANETs Integrating LTE and IEEE 802.11p
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Tech. Report, CQ2017-14, IEICE, Miyazaki, In this paper, we discuss the use of integrating LTE (Long Term Evolution) and IEEE 802.11p for the content distribution in vehicular ad hoc networks (VANETs)., 国内会議
    2017年05月29日
  • デバイス間通信を活用する分散協調キャッシュ機構の提案
    城間隆行; 中島拓真; 吉見真聡; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 信学技報,CPSY2016-159, 電子情報通信学会, 沖縄, 国内会議
    2017年03月10日
  • マルチノードFPGAによるストリームデータ分散結合処理
    多田昂介
    口頭発表(一般), 日本語, 信学技法CPSY2016-112, IEICE, yokohama, 国内会議
    2017年01月23日
  • Performance evaluation of RPL-based sensor data collection in challenging IoT environment
    Liming Gao; Celimuge Wu; Tsutomu Yoshinaga
    口頭発表(一般), 英語, IEICE Tech. Report, CQ2016-91, IEICE, Oosaka, 国内会議
    2017年01月19日
  • A Reinforcement Learning-based Data Storage Scheme for VANETs
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Tech. Report, CQ2016-92, IEICE, Oosaka, 国内会議
    2017年01月19日
  • ネットワーク結合型マルチFPGAボードを用いた集約演算クエリ処理
    川原尚人; 吉見真聡; 策力木格; 吉永努
    ポスター発表, 日本語, 信学技法 CPSY2016-49, 電子情報通信学会, 幕張, 国内会議
    2016年10月06日
  • A context-aware unified routing protocol for vehicular ad hoc networks
    Celimuge Wu; Tsutomu Yoshinaga; Yusheng Ji
    口頭発表(一般), 英語, IEICE Tech. Report, CQ2016-64, IEICE, Tsukuba, We propose a context-aware unified routing protocol for vehicular ad hoc networks (VANETs). The proposed protocol constructs route based on virtual clustering which only exchanges beacon messages in one-hop neighborhood area. The packets are forwarded by the cluster heads, and the last 2-hop route is optimized by using a reinforcement learning algorithm which can attain good performance with low overhead. The advantage of the proposed protocol is shown by using computer simulations., 国内会議
    2016年08月30日
  • インタークラウドを活用した自動災害復旧システム
    溝田敦也; 城間隆行; 中島拓真; 吉見真聡; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 信学技法,CPSY2016-34, 電子情報通信学会, 松本, 国内会議
    2016年08月10日
  • ネットワーク内キャッシュによるISPネットワーク通信電力の削減
    野島幸大; 城間隆行; 中島拓真; 吉見真聡; 策力木格; 吉永 努
    口頭発表(一般), 日本語, 信学技法,CPSY2016-33, 電子情報通信学会, 松本, 国内会議
    2016年08月10日
  • 動画の人気変動に追従する異種キャッシュ混在ネットワークの検討
    中島拓真; 城間隆行; 吉見真聡; 策力木格; 吉永努
    口頭発表(一般), 日本語, 信学技法,CPSY2015-154, 電子情報通信学会, 長崎, 本論文では,動画の人気が急激に変動した際にも高いヒット率を維持するために,ヒット率の高いLFU キャッシュで通信量を削減しつつ,アクセスの急激な変動に強いLRU キャッシュを少量組み合わせて,ヒット率の低下を抑制する.LRU とLFU を混在させた階層ャッシュネットワークでシミュレーションを行い,異種キャッシュを混在させたキャッシュネットワークは急激な人気変動に追従して高いヒット率と短いホップ数を維持できることを確認した., 国内会議
    2016年03月25日
  • Design and Evaluation of Low-Latency Handshake Join on FPGA
    Masato YOSHIMI; Yasin OGE; Celimuge Wu; Tsutomu YOSHINAGA
    口頭発表(一般), 英語, IEICE, Tech. Report, CPSY2015-155, IEICE, Nagasaki, In this paper, we propose an FPGA-based implementation of low-latency handshake join algorithm and present a detailed evaluation of the proposed design., 国内会議
    2016年03月25日
  • Reinforcement learning-based parameter tuning for a broadcast protocol in VANETs
    Celimuge Wu; Satoshi Ohzahata; Yusheng Ji; Tsutomu Yoshinaga; Toshihiko Kato
    口頭発表(一般), 英語, IEICE Tech. Report CQ2015-105, IEICE, Tsukuba, In this paper, we present a broadcast protocol which is able to make forwarding decision based on a self-learning mechanism., 国内会議
    2016年01月21日
  • データストリーム集約演算HWの並列化
    小川芳光; オゲヤースィン; 吉見真聡; 策力木格; 吉永努
    口頭発表(一般), 日本語, 信学技法 CPSY2015-119, 電子情報通信学会, 横浜, 国内会議
    2016年01月19日
  • 3次元積層プロセッサ向けフロアプランナの可視化
    村田篤志; 野村隼人; 吉見真聡; 入江英嗣; 吉永 努; 坂井修一
    その他, 日本語, 信学技報CPSY2015-58, 電子情報通信学会, 幕張, 国内会議
    2015年10月08日
  • RGB-Dセンサと学習による運転姿勢検知
    土門憲司; 野村隼人; 吉見真聡; 入江英嗣; 吉永 努; 坂井修一
    その他, 日本語, 信学技報CPSY2015-59, 電子情報通信学会, 幕張, 国内会議
    2015年10月08日
  • Stubborn Cache: A Novel Strategy for Repeating Thrashing Access Patterns
    Hayato Nomura; Takuma Nakajima; Masato Yoshimi; Tsutomu Yoshinaga; Hidetsugu Irie
    ポスター発表, 英語, Proceedings Notebook for COOL Chips XVIII, 国際会議
    2015年04月13日
  • TSVモジュールの配置最適化アルゴリズムの提案
    村田篤志; 稲場朋大; 吉見真聡; 入江英嗣; 吉永 努
    口頭発表(一般), 日本語, CPSY研究会/信学技報, 電子情報通信学会, 奄美市, 3 次元積層技術の進展によりVLSI の性能や電力を大きく改善することが期待されている.設計最適化のための3 次元フロアプランナのアルゴリズムが様々に提案されているが,TSV の配置について従来手法では近似がされており,最適化は正確ではない.そこで本論文では,TSV をモジュール同様に配置最適化するアルゴリズムを提案
    する.提案アルゴリズムを実装して得られた3 次元プロセッサのフロアプランでは有効なTSV 位置には傾向があることが示され,配線アクティビティについて従来よりも28.4%正確な見積もりで最適化ができることがわかった., 国内会議
    2015年03月15日
  • 複数FPGAボードを用いたビッグデータ分割処理の高速化
    工藤 龍; 須戸里織; オゲ ヤースィン; 寺田祐太; 吉見真聡; 入江英嗣; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会CPSY研究会/信学技法, 電子情報通信学会, 横浜, 本研究報告では,生命科学における配列類似性検索を対象に塩基配列データベースを分散配置するハードウェアを実装し,評価した結果について議論する., 国内会議
    2015年01月30日
  • コンテンツピース毎のアクセス頻度によるWeb キャッシュ機構の構築
    城間隆行; 中島拓真; 吉見真聡; 入江英嗣; 吉永努
    ポスター発表, 日本語, 電子情報通信学会/コンピュータシステム研究会CPSY2014-92, 電子情報通信学会, 東京, 本研究報告では,動画コンテンツ内のアクセス頻度の差に着目し,動画を分割したコンテンツピースを対象にキャッシュ制御を行うことで,効率的にデータ配信を行うキャッシュ機構を提案する., 国内会議
    2014年12月01日
  • SDNによるWeb キャッシュサーバ間通信の効率化
    中島拓真; 吉見真聡; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 電子情報通信学会/コンピュータシステム研究会CPSY2014-59, 電子情報通信学会, 広島, 通信速度向上と通信量削減を同時に実現することを目的として,広帯域な経路を動的に選択する経路制御を開発し,Web キャッシュサーバ間通信の効率化手法を提案する., 国内会議
    2014年11月13日
  • AirTargetシステムにおけるカーソルの予測描画によるUIの改善
    中島嵩文; 千竃航平; 岩崎 央; 吉見真聡; 入江英嗣; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会/信学技法, 電子情報通信学会, 幕張, 国内会議
    2014年10月10日
  • 相対チェックポイントを用いた運転者支援の検討
    土門憲司; 吉見真聡; 入江英嗣; 吉永 努
    口頭発表(一般), 日本語, 電子情報通信学会/信学技法 CPSY2014-47, 電子情報通信学会, 幕張, 国内会議
    2014年10月10日
  • STRAIGHTシミュレータによるループ実行の評価
    佐保田 誠; 山中 崇弘; 吉見 真聡; 吉永 努; 入江 英嗣
    ポスター発表, 日本語, 情報処理学会/研究報告, 情報処理学会, 別府, 国内会議
    2014年10月07日
  • プリフェッチ精度に基づくキャッシュライン保持手法
    力 翠湖; 吉見 真聡; 吉永 努; 入江 英嗣
    口頭発表(一般), 日本語, 情報処理学会/研究報告, 情報処理学会, 別府, 国内会議
    2014年10月06日
  • 動的推定によるキャッシュパーティショニング最適化
    野村 隼人; 力 翠湖; 吉見 真聡; 吉永 努; 入江 英嗣
    口頭発表(一般), 日本語, 情報処理学会研究報告, 情報処理学会, 新潟, 国内会議
    2014年07月28日
  • Smith-Watermanアルゴリズム向けビット並列手法の検討
    須戸里織; 吉見真聡; 入江英嗣; 吉永 努
    口頭発表(一般), 日本語, 信学技法/電子情報通信学会,CPSY2013-90
    2014年01月
  • クラウド環境における透過的データアクセスと計算リソースの動的共有手法
    中島拓真; 吉見真聡; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 信学技法/電子情報通信学会,CPSY2013-55
    2013年11月
  • HMD端末単体で動作する指先認識アルゴリズムの性能評価
    千竃航平; 岩崎央; 森田光貴; 吉見真聡; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 信学技報 CPSY2013-37,コンピュータシステム研究会
    2013年10月
  • 光学シースルー方式HMD に適した直観的ジェスチャーUI
    岩崎 央; 千竃 航平; 森田 光貴; 吉見 真聡; 入江 英嗣; 吉永 努
    口頭発表(一般), 日本語, 信学技報 CPSY2013-38,コンピュータシステム研究会
    2013年10月
  • 省エネルギーな分散処理システムのための専用ハードウェアの設計
    吉見真聡; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 再生可能集積システム時限研究会報告/電子情報通信学会,第8回 再生可能集積システム時限研究会
    2013年10月
  • 座位状態での心拍測定を用いたリアルタイムなストレス緩和システム
    佐久間 大輝; 神田 尚子; 吉見 真聡; 吉永 努; 入江 英嗣
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア、分散、協調とモバイル(DICOMO2013)シンポジウム, 情報処理学会, 北海道
    2013年07月
  • タッチ指示によるお供ロボットナビゲーション
    小野澤 清人; 芝 星帆; 吉永 努; 入江 英嗣
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2013)シンポジウム, 情報処理学会, 北海道
    2013年07月
  • プリフェッチ情報から再参照予測を行うキャッシュライン置き換えアルゴリズム
    力翠湖; 眞島一貴; 藤原大輔; 吉見真聡; 吉永努; 入江英嗣
    口頭発表(一般), 日本語, ARC研究報告/情報処理学会,SWoPP 2013
    2013年07月
  • 相対座標を用いた運動指導システム
    黒田 修平; 放地 宏佳; 吉見 真聡; 吉永 努; 入江 英嗣
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2013)シンポジウム, 情報処理学会, 北海道
    2013年07月
  • もしILPプロセッサのレジスタファイルが分散キーバリューストアになったら
    入江英嗣; 山中崇弘; 佐保田誠; 吉見真聡; 吉永努
    口頭発表(一般), 日本語, ARC研究報告/情報処理学会,SWoPP 2013
    2013年07月
  • FPGA-based Implementation of Sliding-Window Aggregates over Data Streams
    Yasin OGE; Masato YOSHIMI; Takefumi MIYOSHI; Hideyuki KAWASHIMA; Hidetsugu IRIE; Tsutomu YOSHINAGA
    口頭発表(一般), 英語, CPSY2012-74
    2013年01月
  • 配線アクティビティを考慮した3次元積層プロセッサ向けフロアプランナーのための熱評価手法
    稲場朋大; 放地宏佳; 藤原大輔; 眞島一貴; 吉見真聡; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 情報処理学会研究報告
    2013年01月
  • 色彩環境下での心拍変動との作業能率の相関に関する検討
    神田尚子; 佐久間大輝; 吉永努; 入江英嗣
    シンポジウム・ワークショップパネル(公募), 日本語, 第20回インタラクティブシステムとソフトウェアに関するワークショップ, 日本ソフトウェア科学会
    2012年12月
  • 顔検出とエッジ抽出を利用した携帯端末による自撮り支援システムの提案
    芝星帆; 入江英嗣; 吉永努
    シンポジウム・ワークショップパネル(公募), 日本語, 日本ソフトウェア科学会, 青森
    2012年12月
  • スマートフォンによる歩行動作分析の評価
    樫原 裕大; 清水 裕基; 吉永 努; 入江 英嗣
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2012)シンポジウム, 情報処理学会, 加賀市
    2012年07月
  • レーザー光を利用したデバイス間通信における直観的な接続方法の提案
    小木 真人; 大木 裕太; 吉永 努; 入江 英嗣
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2012)シンポジウム, 情報処理学会, 加賀市
    2012年07月
  • ネットワークコンピューティングのための包括的マッシュアップフレームワークIDUMOの設計
    放地 宏佳; 三好 健文; 入江 英嗣; 吉永 努
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2012)シンポジウム, 情報処理学会, 加賀市
    2012年07月
  • TCPセッションへの識別子付与による複数プロセス横断可能な処理追跡法
    清水 裕基; 三好 健文; 入江 英嗣; 吉永 努
    シンポジウム・ワークショップパネル(公募), 日本語, 第23回 コンピュータシステム・シンポジウム (ComSys 2011), 情報処理学会, 京都
    2011年12月
  • スマートフォンを用いた歩行動作改善ツールの開発
    樫原裕大; 清水裕基; 三好健文; 吉永努; 入江英嗣
    口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム研究会
    2011年11月
  • ネットワークコンピューティングのための包括的マッシュアップフレームワークの検討
    放地宏佳; 三好健文; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム(UBI)研究会
    2011年11月
  • 覗き込みを利用した直感的な外部ディスプレイアクセス方式の提案
    小木真人; 清水裕基; 三好健文; 吉永努; 入江英嗣
    口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム(UBI)研究会
    2011年11月
  • 関連データ先読みとスマートフォンの消費電力に関する研究
    小貫貴央; 神田尚子; 放地宏佳; 吉永 努; 入江英嗣
    口頭発表(一般), 日本語, 第10回情報科学技術フォーラムFIT2011
    2011年09月
  • 視覚神経系モデルシミュレーションの複数GPUによる高速化
    大村純一; 佐藤俊治; 江頭明; 三好健文; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 情報処理学会研究報告,HPC研究会
    2011年07月
  • MPIを埋め込み可能なGPUプログラミングフレームワーク適用可能性の評価
    島圭吾; 三好健文; 近藤正章; 入江英嗣; 本多弘樹; 吉永努
    口頭発表(一般), 日本語, 信学技報,CPSY研究会2011-17
    2011年07月
  • 視覚神経系数理モデルシミュレーションのMPIによる並列化
    齋藤祐典; 佐藤俊治; 大村純一; 三好健文; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 情報処理学会研究報告,HPC研究会
    2011年05月
  • MPIを埋め込み可能なGPUプログラミングフレームワークの検討
    三好健文; 近藤正章; 入江英嗣; 吉永努; 本多弘樹
    シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウムSACSIS2011, 情報処理学会, 東京
    2011年05月
  • 3次元積層プロセッサ向けブロック配置問題の検討
    松村雄貴; 三好健文; 吉永努; 入江英嗣
    口頭発表(一般), 日本語, 情報処理学会研究報告,ARC研究会
    2011年04月
  • クラウドによる携行可能な指先での署名認証システムの開発
    寺西良太; 三好健文; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 情報処理学会研究報告,ユビキタスコンピューティングシステム研究会(UBI)
    2011年03月
  • 動的再構成可能ストリーム処理エンジンとクエリコンパイラの検討
    三好健文; 寺田祐太; 川島英之; 吉永努
    シンポジウム・ワークショップパネル(公募), 日本語, 第52回プログラミングシンポジウム, 情報処理学会, 熱海市
    2011年01月
  • FPGAを用いたデータストリームに対するウィンドウジョインの検討
    寺田祐太; 三好健文; 川島英之; 吉永努
    口頭発表(一般), 日本語, 信学技報/電子情報通信学会,Reconf2010-80
    2011年01月
  • メニーコア時代に向けたインオーダ・アーキテクチャ再考
    三好健文; 入江英嗣; 松村雄貴; 吉永 努
    口頭発表(一般), 日本語, 信学技報/電子情報通信学会,CPSY研究会(CPSY2010-36)
    2010年12月
  • PCクラスタによる行動支援サービスプラットフォームZeoBroの初期実装と評価
    田島裕太; 三好健文; 秋岡明香; 後藤達弥; 入江英嗣; 吉永 努
    口頭発表(一般), 日本語, 信学技報/電子情報通信学会,情報ネットワーク研究会(IN2010-93)
    2010年11月
  • 携帯端末とネットワーク上計算資源の協調によるカメラセンサアプリ高速化の検討
    高橋信宏; 入江英嗣; 吉永 努; 寺西良太; 清水裕基
    口頭発表(一般), 日本語, 情報処理学会,第9回科学技術フォーラムFIT2010
    2010年09月
  • コンパイラとランタイムによるソフトウェアキャッシュの更新オーバヘッド隠蔽手法
    三好健文; 吉瀬謙二; 入江英嗣; 吉永努
    口頭発表(一般), 日本語, 情報処理学会研究報告,ARC研究会
    2010年08月
  • 携帯端末のセンサ及び画像を用いたコンテンツ紐付け手法に関する提案
    藤本 数矢; 寺西 良太; 吉永 努; 入江 英嗣; 三好 健文; 鈴木 良宏
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2010)シンポジウム, 情報処理学会, 岐阜
    2010年07月
  • 資源情報の特徴抽出によるモデル化手法と攻撃検知法の提案
    清水裕基; 菅谷みどり; 秋岡明香; 吉永 努
    口頭発表(一般), 日本語, 情報処理学会,創立50周年記念(第72回)全国大会
    2010年03月
  • パターン学習を用いた未知のSQLインジェクション攻撃検知システム
    八木達哉; 秋岡明香; 吉永 努
    口頭発表(一般), 日本語, 情報処理学会,創立50周年記念(第72回)全国大会
    2010年03月
  • Computer Aided Detection System Implementation for Mammograms over a FPGA
    Yessica Suarez Henandez; Sayaka Akioka; Tsutomu Yoshinaga; Gonzalo Duchen Sanchez; Volodymyr Ponomaryov
    口頭発表(一般), 英語, IEICE-RECONF2009-62
    2010年01月
  • 予測ルータによる低遅延Fat Treeネットワーク
    館下智明; 秋岡明香; 吉永努; 松谷宏紀; 鯉渕道紘
    口頭発表(一般), 日本語, ARC研報/情報処理学会,計算機アーキテクチャ研究会
    2009年08月
  • 細粒度リソース監視による攻撃検出手法の提案と考察
    清水裕基; 菅谷みどり; 秋岡明香; 吉永 努
    口頭発表(一般), 日本語, ソフトウェア科学会,第26回大会
    2009年08月
  • Prediction Switching for Photonic Network-on-chip
    Cisse Ahmadou Dit ADI; Hiroki Matsutani; Michihiro Koibuchi; Sayaka Akioka; Tsutomu Yoshinaga
    口頭発表(一般), 英語, ARC研報/情報処理学会,第176回計算機アーキテクチャ研究会
    2009年08月
  • 位置情報を媒体としたWebコミュニケーションツールの開発
    後藤 達弥; 秋岡 明香; 吉永 努
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO2009)シンポジウム, 情報処理学会, 別府
    2009年07月
  • DLNA情報家電の遠隔接続およびWebアプリケーションへの応用
    深田 将史; 小山 卓視; 秋岡 明香; 吉永 努; 鈴木 良宏
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア,分散,協調とモバイル(DICOMO 2009)シンポジウム, 情報処理学会, 別府
    2009年07月
  • 低遅延オンチップネットワークのための予測ルータの評価
    松谷宏紀; 鯉渕道絋; 天野英晴; 吉永努
    シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウムSACSIS 2009, 情報処理学会, 広島
    2009年05月
  • マルチリンクEthernet環境におけるSMPクラスタの性能評価
    小林智史; Shan Axida; 吉永努
    口頭発表(一般), 日本語, 情報処理学会,第71回全国大会
    2009年03月
  • 低遅延オンチップネットワークのための予測ルータの評価
    松谷宏紀; 鯉渕道紘; 天野英晴; 吉永 努
    口頭発表(一般), 日本語, 情報処理学会、計算機アーキテクチャ研究会,2009-ARC-181
    2009年01月
  • Mechanism for Sharing Media Content in Multiple Home Network Environments
    JingYuan Wu; Tsutomu Yosinaga; Daigo Muto; Takumi Koyama
    口頭発表(一般), 英語, 2008-UBI-19
    2008年07月
  • DMPで操作するDLNA機器とテレビ放送の遠隔視聴システムの提案
    小山卓視; 武藤大悟; 吉永 努
    シンポジウム・ワークショップパネル(公募), 日本語, マルチメディア、分散、協調とモバイル(DICOMO2008)シンポジウム, 情報処理学会, 札幌
    2008年07月
  • 予測機構を持つルータを用いた低遅延ネットワークオンチップに関する研究
    鯉渕 道紘; 吉永 努; 村上 弘和; 松谷 宏紀; 天野 英晴
    シンポジウム・ワークショップパネル(公募), 日本語, SACSIS 2008, 情報処理学会, つくば
    2008年06月
  • 予測機構を持った低遅延オンチップルータアーキテクチャ
    松谷宏紀; 鯉渕道紘; 天野英晴; 吉永 努
    口頭発表(一般), 日本語, 情報処理学会,計算機アーキテクチャ研究会
    2008年05月
  • Pipelined Round-Robin Broadcast Algorithm in Homogeneous Clusters of SMP
    Axida; T. Q. Viet; T. Yoshinaga
    口頭発表(一般), 英語, HOKKE-2008
    2008年03月
  • Mobile-WormholeDevice: DLNA情報家電の相互遠隔接続支援機構の携帯端末への応用
    小山卓視; 武藤大悟; 呉 敬源; 吉永 努
    口頭発表(一般), 日本語, 情報処理学会研究報告,第44回モバイルコンピューティングとユビキタス通信・第17回ユビキタスコンピューティングシステム合同研究発表会
    2008年03月
  • 通信予測機構を用いた低遅延ネットワークの構成方法と評価
    村上弘和; 吉永努; 鯉渕道紘
    口頭発表(一般), 日本語, 計算機アーキテクチャ研究会報告,第167回 情報処理学会 計算機アーキテクチャ研究会 (ARC)
    2007年11月
  • ワームホールデバイス:DLNA情報家電の遠隔相互接続支援機構
    武藤大悟; 吉永努
    口頭発表(一般), 日本語, 情報処理学会,マルチメディア,分散,協調とモバイルシンポジウムアブストラクト集
    2007年07月
  • 2-D トーラスネットワークにおける動的通信予測の効果
    吉永努; 村上弘和; 鯉渕道紘
    シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウムSACSIS2007, 情報処理学会, 東京
    2007年05月
  • 耐故障ネットワークルーティングに対するスロットリングに関する考察
    村上弘和; 鎌倉正司郎; 吉永努
    口頭発表(一般), 日本語, 情報処理学会第69回全国大会論文集,情報処理学会第67回全国大会
    2007年03月
  • 情報家電ネットワークの遠隔相互接続のためのネットワークアーキテクチャ
    武藤大悟; 吉永努
    口頭発表(一般), 日本語, 情報処理学会第69回全国大会論文集,情報処理学会第67回全国大会
    2007年03月
  • Analysis of Prediction Accuracy for Communications on k-ary n-cubes
    T. Yoshinaga; M. Koibuchi; S. Kamakura
    シンポジウム・ワークショップパネル(公募), 英語, 10th Int. Workshop on Innovative Architecture for Future Generation High-Performance Processors and Systems (IWIA07), Maui, Hawaii
    2007年01月
  • Output Port Prediction for Messages in 2-D Torus Routers
    T. Yoshinaga
    シンポジウム・ワークショップパネル(公募), 英語, Tunisia-Japan Symposium on Society, Science and Technology 2006, Borj-Cedria Science and Technology Park, Tunisia, and ARENA of the University of Tsukuba, Sousse
    2006年12月
  • 2Dトーラスネットワークにおける動的予測ルーティング
    鎌倉正司郎; 吉永努; 鯉渕道紘
    口頭発表(一般), 日本語, 計算機アーキテクチャ研究会報告(2006-ARC-169)/情報処理学会,計算機アーキテクチャ研究会(2006-ARC-169)
    2006年08月
  • 耐故障・適応ルーティングの自動チューニングに関する研究
    西村康彦; 鎌倉正司郎; 吉永努; 鯉渕道紘
    シンポジウム・ワークショップパネル(公募), 日本語, 先進的計算基盤システムシンポジウム SACSIS06, 情報処理学会・計算機アーキテクチャ研究会他, 大阪
    2006年05月
  • Improving Linpack Performance on SMP Clusters with Asynchronous MPI Programming
    T. Q. Viet; T. Yoshinaga
    シンポジウム・ワークショップパネル(公募), 英語, Symposium on Advanced Computing Systems and Infrastructures (SACSIS), IPSJ SIG ARC, IEICE SIG Computer System, etc., Oosaka
    2006年05月
  • 2Dトーラスネットワークにおける通信方向予測ルーティング
    鎌倉正司郎; 西村康彦; 吉永努; 鯉渕道紘
    口頭発表(一般), 日本語, 情報処理学会,第68回大会
    2006年03月
  • Dynamic Tuning Impact on a Fault-Tolerant and Adaptive Routing Function
    T. Yoshinaga; Y. Nishimura
    シンポジウム・ワークショップパネル(公募), 英語, The 6th Tunisian Japanese Seminar on Culture, Science and Technology, Borj Cedria Science and Technology Park, Tunisia, and ARENA of the University of Tsukuba, Sousse
    2005年11月
  • Performance Enhancement for Matrix Multiplication on an SMP PC Cluster
    Ta Quoc Viet; Tsutomu Yoshinaga; Ben A. Abderazek
    口頭発表(一般), 英語, 2005-HPC-103 (SWoPP 05)
    2005年08月
  • 耐故障・適応ルーティングのためのネットワーク再構成プロトコルの評価
    吉永努; 西村康彦; 曽和将容
    口頭発表(一般), 日本語, 先進的計算基盤システムシンポジウム
    2005年05月
  • 耐故障・適応ルーティングのセルフチューニングに関する検討
    西村康彦; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 電子情報通信学会 技術研究報告, CPSY2005-4,Vol.105, No.3
    2005年04月
  • キャンパスP2Pネットワークにおけるパーソナライズド検索
    杉原健司; 志田匡士; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 電子情報通信学会技術研究報告,組み込み技術とネットワークに関するワークショップ
    2005年03月
  • Rapid FPGA Prototyping of a Queue Processor Core for Embedded Computing
    B. A. Abderazek; T. Yoshinaga; M. Sowa
    口頭発表(一般), 英語, IPSJ 67th Annual Convention
    2005年03月
  • 生産順序キューマシン命令コード生成手法の提案
    川島祐介; 繁田聡一; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 第67回全国大会
    2005年03月
  • 耐故障Detour-UDルーティングアルゴリズムのシミュレーションによる評価
    船山裕右; 戸村元; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会 第67回全国大会 講演論文集
    2005年03月
  • k-ary n-cube ネットワークの輻輳回避ルーティングに関する検討
    西村康彦; 戸村元; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会 第67回全国大会 講演論文集
    2005年03月
  • JXTAを用いたP2Pネットワークにおける認証機能委託と知的検索
    志田匡士; 杉原健司; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会 第67回全国大会 講演論文集
    2005年03月
  • A General Purpose Assembler for Queue Computers
    A. Canedo; B. A. Abderazek; 吉永努; 曽和将容
    口頭発表(一般), 英語, 67th IPSJ Annual Convention
    2005年03月
  • 並列キュー計算モデルの理論的特性評価
    Halcham Kutluk; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第67回全国大会
    2005年03月
  • 生産型キュープロセッサの実用化に関する研究
    仲谷陵; Ben A. Abderazek; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第67回全国大会
    2005年03月
  • FaRMqs: Hybrid Processor Architecture in Verilog-HDL
    M. M. Akanda; Abderazek Ben; 吉永努; 曽和将容
    口頭発表(一般), 英語, 67th Annual Convention
    2005年03月
  • Verilog-HDLによる並列キュープロセッサのデザイン
    三好崇之; ABDERAZEK Ben; 繁田聡一; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 第3回情報科学技術フォーラムFIT04講演論文集
    2004年09月
  • Optimization for Hybrid MPI-OpenMP Programs with Thread-to-thread Communication
    Ta Quoc Viet; Tsutomu Yoshinaga; Masahiro Sowa
    口頭発表(一般), 英語, 電子情報通信学会 技術研究報告
    2004年07月
  • 並列キュー計算モデルの基本特性評価
    Halcham Kutluk; Ben A. Abderazek; 繁田聡一; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 電子情報通信学会技術研究報告
    2004年07月
  • 耐故障性を考慮した k-ary n-cube 用デッドロック回復ルーティング
    吉永努; 細越洋行; 曽和将容
    口頭発表(一般), 日本語, 先端的計算基盤システムシンポジウム論文集
    2004年05月
  • 動的故障に対応する並列計算機用適応ルータに関する検討
    戸村元; 細越洋行; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 電子情報通信学会 技術研究報告, CPSY2004-8,Vol.104, No.12
    2004年04月
  • QJavaプロセッサの設計とVerilogシミュレータによる動作検証
    阿部俊輔; 繁田聡一; B. A. Abderazek; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
    2004年03月
  • 2バイト固定命令長キューマシンアーキテクチャの性能評価
    山崎淳一; B. A. ABDERAZEK; 繁田聡一; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
    2004年03月
  • 生産順序キューマシン命令コード生成手法の提案
    川島祐介; Ben A. Abderazek; 繁田聡一; 吉永 努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
    2004年03月
  • 同時マルチスレッディング(SMT)技術を用いたマルチスレッド並列キュープロセッサのハードウエア設計
    佐々木博敏; 奥村義智; B. A.Abderazek; 繁田聡一; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
    2004年03月
  • Queue Computation Mechanism For Parallel execution in Parallel Queue Processor
    M. M. Akanda; B. A. Abderazek; 繁田聡一; 吉永努; 曽和将容
    口頭発表(一般), 英語, 66th IPSJ Annual Convention
    2004年03月
  • プレゼンス情報によるP2Pネットワーク支援
    杉原健司; Xuanhoa Tran; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会 第66回大会
    2004年03月
  • PQPpfB: Parallel Queue Processor Architecture in Verilog-HDL
    B. A. Abderazek; M. Arsenji; K. Kiuchi; M. M. Akanda; S. Shigeta; T. Yoshinaga; M. Sowa
    口頭発表(一般), 英語, 66th IPSJ Annual Convention
    2004年03月
  • Instruction Set Architecture for Parallel Queue Processor
    M. Arsenij; B. A. Abderazek; S. Shigeta; H. Kutluk; M. Sowa; T. Yoshinaga
    口頭発表(一般), 英語, 66th IPSJ Annual Convention
    2004年03月
  • 生産順序型並列キュープロセッサのための効率的な命令発行のメカニズム
    木内和之; Ben Abderazek; 繁田聡一; 曽和将容; 吉永努
    口頭発表(一般), 日本語, 情報処理学会,第66回大会
    2004年03月
  • キュー実行方式に基づくキューJava仮想マシンの実現
    茂野収; 繁田聡一; B. A. Abderazek; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
    2004年03月
  • QJava VMの実装と動作検証
    柳下伸幸; 繁田聡一; B. A. Abderazek; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会,第66回全国大会
    2004年03月
  • Design of Producer-order Parallel Queue Processor Architecture
    Arsenij Markovskij; Masahiro Sowa; Ben Abderazek; Soichi Shigeta; Tsutomu Yoshinaga
    口頭発表(一般), 英語, Technical Report of IEICE, CPSY2003-26
    2004年01月
  • JXTAネットワークに対するユーザ認証およびアクセス制御の導入
    Xuanhoa Tran; 杉原健司; 吉永努; 曽和将容
    口頭発表(一般), 英語, 情報処理学会、コンピュータセキュリティ研究会、研究報告
    2003年12月
  • Reduced Bit-Width Instruction Set Architecture for Q-mode Execution in Hybrid Processor Architecture (FaRM-rq)
    Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
    口頭発表(一般), 英語, IPSJ SIG Technical Reports, HPC
    2003年06月
  • An Ambiguous, Context-Free Grammar for Deterministic Parsing In Queue-Java Compiler
    Li. Qiang Wang; Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
    口頭発表(一般), 英語, IPSJ SIG Technical Report, HPC
    2003年06月
  • バイトコードレベルの高い並列性を持つQJavaの提案
    繁田聡一; 王立強; Ben A. Abderazek; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 先端的計算基盤システムシンポジウム論文集
    2003年05月
  • Fast, Effective Instruction Generation Algorithm for Queue-Java Compiler (QJAVAC)
    Li. Qiang Wang; Ben A. Abderazek; Soichi Shigeta; Tsutomu Yoshinaga; Masahiro Sowa
    口頭発表(一般), 英語, IPSJ SIG Technical Report, ARC-153
    2003年05月
  • 耐故障性を備えた完全適応ルータの設計
    細越洋行; 水戸部理; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 先端的計算基盤システムシンポジウム論文集
    2003年05月
  • A Hybrid MPI-OpenMP Solution for a Linear System on a Cluster of SMPs
    Ta Quoc Viet; Tsutomu Yoshinaga; Ben A. Abderazek; Masahiro Sowa
    口頭発表(一般), 英語, Proc. Symposium on Advanced Computing Systems and Infrastructures
    2003年05月
  • QJavaプロセッサの基本設計
    繁田 聡一; 阿部俊輔; B. A. Abderazek; 吉永 努; 曽和 将容
    口頭発表(一般), 日本語, 電子情報通信学会、信学技報(CPSY)
    2003年04月
  • Jiniネットワークへのアクセス制御機能の導入
    宮本幹大; Hoa Tran Xuan; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会第65回全国大会
    2003年03月
  • 迂回制御を考慮した適応ルータの設計
    細越洋行; 水戸部理; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 第6回システムLSIワークショップ資料集
    2002年11月
  • 並列キュープロセッサの基本設計
    B. A. Abderazek; 繁田 聡一; K. Nikolova; 吉永 努; 曽和 将容
    口頭発表(一般), 日本語, 電子情報通信学会技術研究報告(CPSY)
    2002年11月
  • SMPクラスタにおけるハイブリッドMPI-OpenMPプログラミングのためのマスタ-スレーブアルゴリズム
    Ta Quoc Viet; Tsutomu Yoshinaga; Masahiro Sowa
    口頭発表(一般), 英語, 情処学研報HPC
    2002年08月
  • 適応ルーティングを用いたPCクラスタ用ネットワークスイッチの提案
    水戸部理; 吉永努; 曽和 将容
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP2002
    2002年05月
  • 仮想チャネル接続の違いによるルータの性能比較
    水戸部理; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会第64回大会3ZB-3
    2002年03月
  • キュー構文木を用いたJavaコンパイラ
    王立強; 吉永努; 曽和将容
    口頭発表(一般), 日本語, 情報処理学会第64回大会5ZB-02
    2002年03月
  • マルチFPGAベース・カスタム計算機による医療用画像処理
    横田隆史; 永淵雅道; 目加田慶人; 吉永努; 大津金光; 馬場敬信
    口頭発表(一般), 日本語, FPGA/PLD Design Conference論文集
    2002年01月
  • 並列デッドロック回復ルータRecover-XのLSI試作
    御代田雅俊; 吉永努; 横田隆史; 大津金光; 馬場敬信
    口頭発表(一般), 日本語, 信学技報(ICD2001-69)
    2001年08月
  • 並列FPGAシステムによる医療用画像処理の高速化
    永淵雅道; 吉永努; 横田隆史; 大津金光; 馬場敬信
    口頭発表(一般), 日本語, 信学技報(CPSY2001-44)
    2001年07月
  • 異なるプラットフォームにおける受信メッセージ予測法の性能評価
    足立涼子; 岩本善行; 大津金光; 吉永 努; 馬場敬信
    口頭発表(一般), 日本語, 情報処理学会研究報告
    2000年09月
  • 適応ルータにおける最適な仮想チャネル数に関する考察
    堀田真貴; 吉永 努; 大津金光; 馬場敬信
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP2000
    2000年06月
  • SOCノードで構成する並列計算機の性能評価
    古川文人; 大津金光; 吉永 努; 馬場敬信
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP2000
    2000年06月
  • 並列デッドロック回復ルータRecover-xの性能評価
    林匡哉; 堀田真貴; 中村さゆり; 吉永努; 大津金光; 馬場敬信
    口頭発表(一般), 日本語, 情処学ARC研報
    2000年
  • 適応ルータの効率的な並列デッドロックリカバリ方式の提案
    林匡哉; 堀田真貴; 吉永努; 大津金光; 馬場敬信
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '99
    1999年
  • システムオンチップ化ノードで構成する並列計算機の性能評価
    古川文人; 大津金光; 吉永努; 馬場敬信
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '99
    1999年
  • 受信メッセージ予測法の実装と評価
    岩本善行; 大津金光; 吉永努; 馬場敬信
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '99
    1999年
  • MIMD並列計算機における仮想時間を用いた性能評価法
    岩本善行; 阿部大輝; 大津金光; 吉永努; 馬場敬信
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '98
    1998年
  • 適応ルータのコストパフォーマンス
    吉永努; 山口喜教
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '98
    1998年
  • トポロジ独立なA-NETマルチコンピュータの通信性能
    澤田東; 阿部大輝; 廣田守; 吉永努; 馬場敬信
    口頭発表(一般), 日本語, 並列処理シンポジウムJSPP '97
    1997年

担当経験のある科目_授業

  • アカデミックリテラシー
    電気通信大学
  • 論理回路学
    電気通信大学
  • コンピュータ設計論
    電気通信大学
  • 論理設計学
    電気通信大学
  • ネットワークコンピューティング論2
    電気通信大学
  • コンピュータサイエンス実験第2AB
    電気通信大学
  • 計算機ネットワーク特論
    電気通信大学
  • 大学院技術英語
    電気通信大学

所属学協会

  • 電子情報通信学会
  • IEEE
  • ACM
  • 情報処理学会

共同研究・競争的資金等の研究課題

  • 通信量削減と低遅延応答のための分散協調キャッシュサーバアーキテクチャに関する研究
    吉永 努
    日本学術振興会, 科学研究費助成事業 基盤研究(C), 電気通信大学, 基盤研究(C), 研究代表者, 2021年度は,ネットワークの動画配信サービスを対象として,以下の研究を実施した. 1.高負荷時にも配信サービスが停止しにくいキャッシュサーバの設計 ユーザからのリクエスト量の時間変化分を予測し,高負荷時には配信する動画の画質を自動的に低下させる方式を採用する.動画のキャッシュサーバは,通信負荷に合わせてより重要なデータのヒット率が向上するように,画質毎の優先度付きキャッシュ制御を行う.提案方式を組み込んだコンテンツ配信ネットワーク(CDN)シミュレータを作成し,優先度付きキャッシュ制御方式の有効性を考察した.実験の結果,優先度付きキャッシュは従来方式のユーザQoEを改善できることを確認した.また,モバイルデバイスで構成する分散協調キャッシュとの併用についても検討した. 2.FPGA搭載型キャッシュサーバの設計 動画配信ネットワーク用のキャッシュサーバにFPGAボードを搭載し,FPGAに実装する専用ハードウェアによってネットワークの通信プロトコル処理,コンテンツ検索,メモリ(DRAM)やストレージ・アクセスを実行する.FPGA実装の目的は,キャッシュ制御処理の低遅延化,低消費電力化である.2021年度は,FPGAに実装するキャッシュ制御ハードウェアを試作し,まず単発のユーザリクエストを処理する実験を行った.予備実験の結果,FPGAを用いたキャッシュ制御のハードウェア化によって,ユーザリクエスト処理の低遅延化が実現できる見通しを得た., 21K11805
    2021年04月 - 2024年03月
  • 数理モデルと機械学習の統合的手法による次世代無線システムの高信頼実時間制御
    計 宇生; 金子 めぐみ; 村瀬 勉; 吉永 努; 策力 木格; 江 易翰
    日本学術振興会, 科学研究費助成事業 基盤研究(A), 国立情報学研究所, 基盤研究(A), 研究分担者, 2020年度では、以下の項目に関する研究を実施した。 1)数理モデルと機械学習の統合手法による無線資源割当については、数理モデルの助けを借りて、効果的に学習する方法について検討した。通信と計算資源の割当問題を非線形計画問題として数理モデル化し、モデルのパラメータ化と非制約化転換で、目的と制約の双対関係を利用して、Deep Dual Learningの手法を使った学習を行った。数理モデルによる近似よりも高いシステム性能が得られたことを確認した。また、深層畳込みニューラルネットワークに基づく転移学習を利用して、異なる無線環境にも適用できる周波数検知方法を提案した。 2)コンテクストアウェアな通信とオフローティングについては、自動運転・協調ロボットなどの迅速な判断を行うべき場合において、近隣の最新状況を素早く把握し、端末間で協調分散処理の実現方法について検討を行った。周囲の状況が動的に変化する環境において、強化学習を利用して、車両間の通信経路を先制的に確保する方法を検討した。状況の変化によって、経路を機動的に変えられるようにした結果、既存の手法よりも優れた性能が得られた。また、動的に干渉が存在する環境下におけるミッションクリティカルな車載通信のための品質制御方法について提案した。 3)FPGAを用いた通信処理、AI処理、キャッシングの高速化については、低遅延、高信頼の実時間処理を行うための加速処理をFPGAによって実現する方法として、分散協調キャッシュサーバ処理のFPGAオフロードについて検討を行った。ビックデータ解析のためにストレージとネットワークを密に結合させたFPGAを複数組み合わせたInterconnected-FPGAsと呼ばれるシステムが処理の加速化に有効であり、それを用いて分散協調キャッシュサーバの処理の一部をオフロードすることで、レスポンス時間が短縮されることを確認した。, 20H00592
    2020年04月 - 2024年03月
  • 分散協調キャッシュを用いたコンテンツ配信ネットワークの通信量削減
    吉永 努
    日本学術振興会, 科学研究費助成事業 基盤研究(C), 電気通信大学, 基盤研究(C), 本研究では色タグ方式の分散協調キャッシュ制御手法を提案する。色タグ方式の分散協調キャッシュは、キャッシュサーバとコンテンツにそれぞれ色タグを付して制御する。 また、デバイス間通信を利用したコンテンツ配信機構としてTEA方式を提案する。TEA方式では、基地局通信範囲内及びD2D通信範囲内のモバイル端末数とコンテンツアクセスの偏り(Zipf則の偏り)パラメータを用いて基地局通信量を最小化する。 本研究の成果を活用して分散協調キャッシュ技術を用いたコンテンツ配信網プロトタイプを試作し、小規模な実証実験を行った。実験の結果、キャッシュなしに比べ最大92%の通信量削減効果が得られた。, 18K11259
    2018年04月 - 2021年03月
  • 分散配置キャッシュ利用によるインターネット通信データ量削減の検証
    TIS株式会社, 研究助成
    2016年07月01日 - 2019年03月31日
  • FPGAを用いたデータ処理アクセラレータに関する研究
    株式会社アバールデータ, 研究助成
    2017年02月01日 - 2018年01月31日
  • 専用ハードウェアを用いたデータストリーム管理システムの開発
    吉永 努
    半導体理工学研究センター, アイデア・スカウト(IS) プログラム, 研究代表者, 高速・低電力なストリームデータ処理用ハードウェアを開発し,グリーンコンピューティング技術に貢献する.
    2014年04月 - 2017年03月
  • コンテンツ分割キャッシュを用いた配信ネットワークの効率化
    吉永 努
    電気通信普及財団, 研究助成, 研究代表者, 本研究調査では,動画コンテンツ配信ネットワークの高速化について考察すると共に,動画を分割したコンテンツピース単位でWebキャッシュを制御する手法,及び効率的な配信経路選択手法について提案,評価する.
    2015年04月01日 - 2016年03月31日

産業財産権

  • ネットワークシステム、ノード装置、キャッシュ方法及びプログラム
    特許権, 吉永努, 中島拓真, 森元敏雄, 石橋靖嗣, 特願2018-015767, TIS株式会社,電気通信大学, 特許第67281879
  • ネットワークシステム,キャッシュ方法,キャッシュプログラム,管理装置,管理方法及び管理プログラム
    特許権, 吉永努, 中島拓真, 吉見真聡, 森本敏雄, 村木暢哉, 特願2018-551597, PCT/JP2017/040485, TIS株式会社,国立大学法人 電気通信大学, WO2018/092679, 6712744
  • ネットワークシステム、ノード装置、キャッシュ方法及びプログラム
    特許権, 吉永努, 中島拓真, 森元敏雄, 石橋靖嗣, 特願2017-138406, TIS株式会社,電気通信大学, 特開2019-020994, 6638145, チャンク分割転送する動画の分散協調キャッシュ
  • ネットワークシステム,無線通信端末,通信方法及びプログラム
    特許権, 吉永努, 城間隆行, 中島拓真, 森元敏雄, 石橋靖嗣, 特願2017-175164, TIS株式会社,国立大学法人 電気通信大学, 特開2019-53358(P2019-53358A), 6606808
  • ネットワークシステム、ノード装置、キャッシュ方法及びプログラム
    特許権, 吉永 努, 中島 拓真, 吉見 真聡, 森元 敏雄, 村木 暢哉, 特願2017-105055, TIS株式会社 , 国立大学法人電気通信大学, 特開2018-200581, 6592809, 階層ネットワークにおけるキャッシュ方法及びプログラム
  • 通信端末装置、通信ネットワークシステム、通信方法及び通信プログラム
    特許権, 小木 真人, 入江 英嗣, 大木 裕太, 吉永 努, 特願2012-242584, 国立大学法人電気通信大学, 特開2014-092903, 特許第6061377号, 直観的に連携対象の機器を指定し、煩雑な通信確立手順を経ることなく、連携機器間の接続を確立することができる通信端末装置を提供することを目的とする。
  • ネットワークシステム,キャッシュ方法及びキャッシュプログラム
    特許権, 吉永努, 中島拓真, 吉見真聡, 森本敏雄, 村木暢哉, 特願2016-224243, TIS株式会社,電気通信大学
  • データ処理装置およびデータ処理方法,並びにプログラム
    特許権, オゲヤースィン, 吉見真聡, 入江英嗣, 吉永努, 特願2014-230387, 特開2016-095606
  • 映像データ送出方法、並びに、その方法を実行する映像データ送出装置、その方法をコンピュータに実行させるための映像データ送出プログラム、およびそのプログラムが書き込まれた記録媒体
    特許権, 吉永 努, 小山卓視, 坪田浩乃, 小野松丈洋, 錦織義久, 特願2008-168460, 国立大学法人電気通信大学(50%), 船井電機株式会社(50%), 特許第5257659号
  • ルータおよび並列分散システム
    特許権, 鯉渕道紘, 吉永努, 鎌倉正司郎, 特願2007-135940, 大学共同利用機関法人情報・システム研究機構, 国立大学法人電気通信大学, 特開2008-294586