Emeritus Professor etc. | Emeritus Professor |
- Profile:
1976-1981 : Computer generated hologram, Digital processing of coronary cineangiograms
1981-1994 : Coding of moving image sequence for teleconference and picture phone, Intelligent image coding, Development of moving image processing system
1994-1997 : Integrated 3-D visual communication, Kansei communication, Intelligent communication
1997-1998 : Integrated 3-D visual communication, Multimodal anthropomorphic agent
1998-present : Processing of facial image information, Active interaction based on integration of audio and visual information, Human robot communication, Intelligent robotics, Autonomous robot
Researcher Information
Research Keyword
Field Of Study
Educational Background
Member History
- 01 Apr. 2013
監事, 公益財団法人電気電子情報学術振興財団, Others - Jan. 2008 - Dec. 2009
代表幹事, 視聴覚情報研究会, Society - 1997 - 2009
仮想環境・マルチメディア基礎研究専門委員会専門委員, 電子情報通信学会, Society - 2009
フェロー&マスターズ未来技術時限研究専門委員会委員, 電子情報通信学会, Society - 2005 - 2006
IEEE Tokyo Section, Chair of Nominations Committee, IEEE, Society - 2003 - 2004
評議員, 映像情報メディア学会, Society - 2002 - 2002
IEEE Chapter Operations Committee, Secretary, IEEE, Society - 1999 - 2002
編集顧問, 電子情報通信学会, Society - 1997 - 1998
情報・システムソサイエティ英文論文誌編集委員会編集幹事, 電子情報通信学会, Society - 1997 - 1998
編集幹事, 電子情報通信学会, Society - 1995 - 1997
幹事, 日本顔学会, Society - 1995 - 1997
庶務幹事, 電子情報通信学会, Society - 1997
理事, 日本顔学会, Society - 技術委員会 委員, 映像情報メディア学会, Society
- 技術委員会 幹事, 映像情報メディア学会, Society
- 画像通信システム研究会 幹事, 映像情報メディア学会, Society
- 理事(調査担当), 映像情報メディア学会, Society
Research Activity Information
- Jul. 2017
Others - May 2017
ロボカップ研究賞, Takahiro Kobori;Tomoaki Nakamura;Mikio Nakano;Takayuki Nagai;Naoto Iwahashi;Kotaro Funakoshi;Masahide Kaneko
Others - Jun. 2016
人工知能学会2015年度論文賞, 中村友昭;長井隆行;船越孝太郎;谷口忠大;岩橋直人;金子正秀
Japan society - May 2012
映像情報メディア学会フェロー称号 - 2008
電子情報通信学会フェロー称号 - May 1999
平成10年度(第39回)映像情報メディア学会 丹羽高柳賞 論文賞 - Jul. 1997
3次元画像コンファレンス 1996年度優秀発表表彰 - May 1997
平成8年度(第5回)映像情報メディア学会藤尾フロンティア賞 - Jul. 1988
昭和62年度(第21回)テレビジョン学会鈴木記念賞 - Jul. 1985
昭和59年度日本ME学会論文賞 - Mar. 1985
- Object recognition based robust mapping for the autonomous mobile robot under dynamic environment
Bin Zhang; Masahide Kaneko; Hunok Lim
10th International Conference on Soft Computing and Intelligent Systems and 19th International Symposium on Advanced Intelligent Systems (SCIS&ISIS2018), 1-6, Dec. 2018, Peer-reviwed
International conference proceedings, English - Robust mapping for the autonomous mobile robot considering potential occupied spaces of objects
Bin Zhang; Masahide Kaneko; Hun-Ok Lim
9th International Workshop on Advances in Networking and Computing (WANC’18), 1-6, Nov. 2018, Peer-reviwed
International conference proceedings, English - Sequence pattern extraction by segmenting time series data using GP-HSMM with hierarchical Dirichlet process
Masatoshi Nagano; Tomoaki Nakamura; Takayuki Nagai; Daichi Mochihashi; Ichiro Kobayashi; Masahide Kaneko
2018 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS2018), 4067-4074, Oct. 2018, Peer-reviwed
International conference proceedings, English - Interaction modeling based on segmenting two persons motions using coupled GP-HSMM
Satoru Oshikawa; Tomoaki Nakamura; Takayuki Nagai; Kotaro Funakoshi; Naoto Iwahashi; Mikio Nakano; Masahide Kaneko
27th IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2018), TuAT1.6, 288-293, 28 Aug. 2018, Peer-reviwed
International conference proceedings, English - Multicultural facial expression recognition based on differences of Western-Caucasian and East-Asian facial expressions of emotions
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
IEICE Transactions on Information and Systems, Institute of Electronics, Information and Communication, Engineers, IEICE, E101D, 5, 1317-1324, 01 May 2018, Peer-reviwed, An increasing number of psychological studies have demonstrated that the six basic expressions of emotions are not culturally universal. However, automatic facial expression recognition (FER) systems disregard these findings and assume that facial expressions are universally expressed and recognized across different cultures. Therefore, this paper presents an analysis of Western-Caucasian and East-Asian facial expressions of emotions based on visual representations and cross-cultural FER. The visual analysis builds on the Eigenfaces method, and the crosscultural FER combines appearance and geometric features by extracting Local Fourier Coefficients (LFC) and Facial Fourier Descriptors (FFD) respectively. Furthermore, two possible solutions for FER under multicultural environments are proposed. These are based on an early race detection, and independent models for culture-specific facial expressions found by the analysis evaluation. HSV color quantization combined with LFC and FFD compose the feature extraction for race detection, whereas cultureindependent models of anger, disgust and fear are analyzed for the second solution. All tests were performed using Support Vector Machines (SVM) for classification and evaluated using five standard databases. Experimental results show that both solutions overcome the accuracy of FER systems under multicultural environments. However, the approach which individually considers the culture-specific facial expressions achieved the highest recognition rate.
International conference proceedings, English - Segmenting Continuous Motions with Hidden Semi-markov Models and Gaussian Processes
Tomoaki Nakamura; Takayuki Nagai; Daichi Mochihashi; Ichiro Kobayashi; Hideki Asoh; Masahide Kaneko
FRONTIERS IN NEUROROBOTICS, FRONTIERS MEDIA SA, 11, Article 67, 1-11, Dec. 2017, Peer-reviwed, Humans divide perceived continuous information into segments to facilitate recognition. For example, humans can segment speech waves into recognizable morphemes. Analogously, continuous motions are segmented into recognizable unit actions. People can divide continuous information into segments without using explicit segment points. This capacity for unsupervised segmentation is also useful for robots, because it enables them to flexibly learn languages, gestures, and actions. In this paper, we propose a Gaussian process-hidden semi-Markov model (GP-HSMM) that can divide continuous time series data into segments in an unsupervised manner. Our proposed method consists of a generative model based on the hidden semi-Markov model (HSMM), the emission distributions of which are Gaussian processes (GPs). Continuous time series data is generated by connecting segments generated by the GP. Segmentation can be achieved by using forward filtering-backward sampling to estimate the model's parameters, including the lengths and classes of the segments. In an experiment using the CMU motion capture dataset, we tested GP-HSMM with motion capture data containing simple exercise motions; the results of this experiment showed that the proposed GP-HSMM was comparable with other methods. We also conducted an experiment using karate motion capture data, which is more complex than exercise motion capture data; in this experiment, the segmentation accuracy of GP-HSMM was 0.92, which outperformed other methods.
Scientific journal, English - Analysis of the effect of infant-directed speech on mutual learning of concepts and language based on MLDA and unsupervised word segmentation
Miyuki Funada; Tomoaki Nakamura; Takayuki Nagai; Masahide Kaneko
IROS2017: Workshop on Machine Learning Methods for High-Level Cognitive Capabilities in Robotics, 1-3, Sep. 2017, Peer-reviwed
International conference proceedings, English - Facial expression recognition based on local Fourier coefficients and facial Fourier descriptors
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
Journal of Signal and Information Processing, Scientific Research, 8, 3, 132-151, 07 Aug. 2017, Peer-reviwed
Scientific journal, English - Methodical analysis of Western-Caucasian and East-Asian basic facial expressions of emotions based on specific facial regions
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
Journal of Signal and Information Processing, Scientific Research, 8, 2, 78-98, 18 May 2017, Peer-reviwed
Scientific journal, English - Analysis of in- and out-group differences between Western and East-Asian facial expression recognition
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
Proc. of the Fifteenth IAPR International Conference on Machine Vision Applications (MVA2017), 12-03, 10 May 2017, Peer-reviwed
International conference proceedings, English - Analysis of Differences between Western and East-Asian Faces Based on Facial Region Segmentation and PCA for Facial Expression Recognition
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
The Irago Conference 2016 (Interdisciplinary Research and Global Outlook), GSS2-7, 02 Nov. 2016, Peer-reviwed
International conference proceedings, English - A framework for adaptive motion control of autonomous sociable guide robot
Bin Zhang; Tomoaki Nakamura; Masahide Kaneko
IEEJ TRANSACTIONS ON ELECTRICAL AND ELECTRONIC ENGINEERING, WILEY-BLACKWELL, 11, 6, 786-795, Nov. 2016, Peer-reviwed, We present a framework by which the motion of an autonomous mobile guide robot is adaptively controlled. A sociable robot should adapt its speed and path to suit the users' activities, without restricting the user movement. By generating adaptive artificial potential fields for the users and the subgoal separately, and integrating them with the basic potential fields generated from obstacles, our robot can adapt to the users' activities and provide sociable tour-guide services. The robot predicts a user's moving speed and adapts to it to maintain the social distance. Moreover, with the proposed framework, users can deviate from the guided path temporarily and return to the original task afterward. Instead of waiting for the users and taking the risk of losing them, the robot deviates from its original path to follow the users and also prepares for returning to the guiding task. The robot restarts the guiding task at that place, which ensures the least cost to reach the goal. Simulation and experimental results show that our framework can automatically generate suitable motion patterns to control the robot adaptively, making it sociable while providing tour guide services. (c) 2016 Institute of Electrical Engineers of Japan. Published by John Wiley & Sons, Inc.
Scientific journal, English - Continuous Motion Segmentation Based on Reference Point Dependent GP-HSMM
Tomoaki Nakamura; Kensuke Iwata; Takayuki Nagai; Daichi Mochihashi; Ichiro Kobayashi; Asoh Hideki; Masahide Kaneko
Workshop on Machine Learning Methods for High-Level Cognitive Capabilities in Robotics 2016 (ML-HLCR 2016), Paper ID 6, 14 Oct. 2016, Peer-reviwed
International conference proceedings, English - Robust Comprehension of Spoken Instructions using Multimodal Information for a Domestic Service Robot
Takahiro Kobori; Tomoaki Nakamura; Takayuki Nagai; Naoto Iwahashi; Mikio Nakano; Kotaro Funakoshi; Masahide Kaneko
Workshop on Machine Learning Methods for High-Level Cognitive Capabilities in Robotics 2016 (ML-HLCR 2016), Paper ID 7, 14 Oct. 2016, Peer-reviwed
International conference proceedings, English - Robust Children Behavior Tracking for Childcare Assisting Robot by Using Multiple Kinect Sensors
Bin Zhang; Tomoaki Nakamura; Rena Ushiogi; Takayuki Nagai; Kasumi Abe; Takashi Omori; Natsuki Oka; Masahide Kaneko
SOCIAL ROBOTICS, (ICSR 2016), SPRINGER-VERLAG BERLIN, 9979, 640-649, 2016, Peer-reviwed, Recently, the requirement for the high qualified childcare schools keeps increasing, but the number of qualified nursery teachers is far from enough. Developing a childcare assisting robot is highly necessary to help the works of nursery teachers. To work like a human nursery teacher, the first challenge for the robot is to understand the behaviors of the children automatically so that the robot can give adaptive reactions to the children. In this paper, we developed a robust children behavior tracking system by using multiple Kinect sensors. Each of the child is detected and recognized by integrating his/her personal features of face, color and motion. The tracking process is realized by using the Markov Chain Monte Carlo (MCMC) particle filter. The experiments are conducted in a childcare school to show the usefulness of our system.
International conference proceedings, English - Robust comprehension of natural language instructions by a domestic service robot
Takahiro Kobori; Tomoaki Nakamura; Mikio Nakano; Takayuki Nagai; Naoto Iwahashi; Kotaro Funakoshi; Masahide Kaneko
ADVANCED ROBOTICS, TAYLOR & FRANCIS LTD, 30, 24, 1530-1543, 2016, Peer-reviwed, We present a method through which domestic service robots can comprehend natural language instructions. For each action type, a variety of natural language expressions can be used, for example, the instruction, 'Go to the kitchen' can also be expressed as 'Move to the kitchen.' We are of the view that natural language instructions are intuitive and, therefore, constitute one of the most user-friendly robot instruction methods. In this paper, we propose a method that enables robots to comprehend instructions spoken by a human user in his/her natural language. The proposed method combines action-type classification, which is based on a support vector machine, and slot extraction, which is based on conditional random fields, both of which are required in order for a robot to execute an action. Further, by considering the co-occurrence relationship between the action type and the slots along with the speech recognition score, the proposed method can avoid degradation of the robot's comprehension accuracy in noisy environments, where inaccurate speech recognition can be problematic. We conducted experiments using a Japanese instruction data-set collected using a questionnaire-based survey. Experimental results show that the robot's comprehension accuracy is higher in a noisy environment using our method than when using a baseline method with only a 1-best speech recognition result.
Scientific journal, English - Simultaneous children recognition and tracking for childcare assisting system
Bin Zhang; Tomoaki Nakamura; R. Ushiogi; Takayuki Nagai; K. Abe; T. Omori; N. Oka; Masahide Kaneko
Journal of Signal and Information Processing, Scientific Research, 7, 3, 160-174, 2016, Peer-reviwed
Scientific journal, English - 顔部品の形状特徴及び顔画像の提示方法の違いと顔全体の類似印象との関係
パン ジュン フイ; 中村友昭; 金子正秀
日本顔学会誌, 日本顔学会, 15, 2, 93-104, Dec. 2015, Peer-reviwed
Scientific journal, Japanese - Concept Formation by Robots Using an Infinite Mixture of Models
Tomoaki Nakamura; Yoshiki Ando; Takayuki Nagai; Masahide Kaneko
Proc. of 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS2015), ThAT12.3, 01 Oct. 2015, Peer-reviwed
International conference proceedings, English - Adaptive Fusion of Multi-information Based Human Identification for Autonomous Mobile Robot
Bin Zhang; Tomoaki Nakamura; Masahide Kaneko
The 24th IEEE International Symposium on Robot and Human Interactive Communication, (RO-MAN 2015), TuIS, IS02, 01 Sep. 2015, Peer-reviwed
International conference proceedings, English - Autonomous mobile robot selecting optimum path with safe speed control in consideration of blind area of vision sensors
Tsubasa Kurosaka; Masahide Kaneko
IEEJ Transactions on Electronics, Information and Systems, Institute of Electrical Engineers of Japan, 135, 4, 356-364, 01 Apr. 2015, Peer-reviwed, This paper proposes a speed control method to move an autonomous mobile robot safely under the environment where blind areas exist. Sensors like a LRF or an optical camera cannot detect the areas in the backside of walls, pillars or objects. When a person suddenly appears from these blind areas, the mobile robot is very likely to collide with him/her, if its speed reduction performance is limited. In this paper the safety speed of robot is carefully controlled using the distance information between the robot and the blind areas as well as obstacles. Meanwhile, the optimum path is generated to minimize the cost of moving time, considering the lengthened time cost caused by speed control process. The effectiveness of the proposed method is confirmed by both the computer simulation and the experiment using a real robot.
Scientific journal, Japanese - マルチモーダルLDAとNPYLMを用いたロボットによる物体概念と言語モデルの相互学習
中村友昭; 長井隆行; 船越孝太郎; 谷口忠大; 岩橋直人; 金子正秀
人工知能学会誌, 人工知能学会, 30, 3, 498-509, Mar. 2015, Peer-reviwed
Scientific journal, Japanese - Facial Expression Recognition Based on Facial Region Segmentation and Modal Value Approach
Gibran Benitez-Garcia; Gabriel Sanchez-Perez; Hector Perez-Meana; Keita Takahashi; Masahide Kaneko
IEICE Trans. Inf. & Syst., IEICE, E97-D, 4, 928-935, Apr. 2014, Peer-reviwed
Scientific journal, English - 移動ロボットにおける不動領域グリッドマップを用いた潜在的な動物体に頑健な地図生成
伊藤明久; 高橋桂太; 金子正秀
電気学会論文誌C(電子・情報・システム部門誌), 134, 2, 192-204, Feb. 2014, Peer-reviwed
Scientific journal, Japanese - 動的環境に適応したポテンシャル場の生成に基づく並走・縦走ロボットの移動制御
中澤和至; 高橋桂太; 金子正秀
電気学会論文誌C(電子・情報・システム部門誌), 134, 2, 293-302, Feb. 2014, Peer-reviwed
Scientific journal, Japanese - Recognition of Weak Facial Expressions Based on Decision Tree Votes
Arias Marin Anderson; Keita Takahashi; Masahide Kaneko
日本顔学会誌, 13, 1, 131-140, Oct. 2013, Peer-reviwed
Scientific journal, English - 条件を変えた複数手法の選択的適用による顔特徴点の抽出精度の向上
大川純也; 高橋桂太; 金子正秀
日本顔学会誌, 13, 1, 147-159, Oct. 2013, Peer-reviwed
Scientific journal, Japanese - 自由視点映像生成のための自然特徴点を用いた多眼カメラの自己位置推定法
高橋桂太; 金子正秀
電子情報通信学会和文論文誌D, 画像符号化・映像メディア処理レター特集, J96-D, 9, 2010-2012, Sep. 2013, Peer-reviwed
Scientific journal, Japanese - Unified Environment-Adaptive Control of Accompanying Robots Using Artificial Potential Field
Kazushi Nakazawa; Keita Takahashi; Masahide Kaneko
PROCEEDINGS OF THE 8TH ACM/IEEE INTERNATIONAL CONFERENCE ON HUMAN-ROBOT INTERACTION (HRI 2013), IEEE, 199-200, 2013, Peer-reviwed, Our research is focused on mobile robots that can accompany a person, and this paper addresses how to control the relative position of the robot to the accompanied person according to the dynamic environment. The robot is expected to move side-by-side with the person in the normal situation, but the position in front or behind the person might be better if there are some obstacles. We devised the shape of the artificial potential field of the accompanied person to smoothly control the robot position in a unified way, and obtained favorable results via simulations.
International conference proceedings, English - コンピュータによる写真からの斜め似顔絵生成法の検討
米山彩美; 高橋桂太; 金子正秀
映像情報メディア学会誌, 66, 11, J476-J480, Nov. 2012, Peer-reviwed
Scientific journal, Japanese - Theoretical Analysis on Interframe Predictive Coding with Subpixel Displacement Accuracy – An Exhaustive Search
Keita Takahashi; Masahide Kaneko
VCIP2012 (Visual Communications and Image Processing Conference, Paper ID 82, Nov. 2012, Peer-reviwed
International conference proceedings, English - Quantitative analysis of features and impressions among faces belonging to different categories
Masahide Kaneko
43rd NIPS International Symposium “Face Perception and Recognition”, P19, p.126, Nov. 2012
International conference proceedings, English - 同行者との相対的位置関係を考慮した日常環境下でのロボットの自律的移動
高橋和也; 金子正秀
映像情報メディア学会誌, 65, 10, 1452-1457, Oct. 2011, Peer-reviwed
Scientific journal, Japanese - 顔印象の言葉による記述と類似顔検索への応用~各顔部品の形状と配置による顔印象を対象として~
宮本慎也; 今井順一; 金子正秀
日本顔学会誌, 11, 1, 65-76, Sep. 2011, Peer-reviwed
Scientific journal, Japanese - Block-Based Bag of Words for Robust Face Recognition under Variant Conditions of Facial Expression, Illumination, and Partial Occlusion
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E94A, 2, 533-541, Feb. 2011, Peer-reviwed, In many real-world face recognition applications, there might be only one training image per person available. Moreover, the test images may vary in facial expressions and illuminations, or may be partially occluded. However, most classical face recognition techniques assume that multiple images per person are available for training, and they are difficult to deal with extreme expressions, illuminations and occlusions. This paper proposes a novel block-based bag of words (BBoW) method to solve those problems. In our approach, a face image is partitioned into multiple blocks, dense SIFT features are then calculated and vector quantized into different visual words on each block respectively. Finally, histograms of codeword distribution on each local block are concatenated to represent the face image. Our method is able to capture local features on each block while maintaining holistic spatial information of different facial components. Without any illumination compensation or image alignment processing, the proposed method achieves excellent face recognition results on AR and XM2VTS databases. Experimental results show that only using one neutral expression frame per person for training, our method can obtain the best performance ever on face images of AR database with extreme expressions, variant illuminations, and partial occlusions. We also test our method on the standard and darkened sets of XM2VTS database, and achieve the average rates of 100% and 96.10% on the standard and darkened sets of XM2VTS database, respectively.
Scientific journal, English - Human interactions with a robot that recognizes differences between fields of view
Jun-ichi Imai; Masahide Kaneko
Kansei Engineering International Journal, Japan Society of Kansei Engineering, 10, 1, 59-68, Dec. 2010, Peer-reviwed, It is likely that in the near future, human-symbiotic robots will share people's living spaces. Since there are many objects that can cause visual occlusion in these environments, situations in which a robot cannot see an object due to occlusion whereas a user can, and vice versa, will often occur. In such situations, ideally the human-symbiotic robot should be able to interact with the user while taking into consideration the differences between their fields of view. We anticipate that such a "considerate" robot will be friendlier and provide more pleasant interactions with users. In this paper, we aim to test this anticipation. First, we propose a robot that can estimate a user's and its own fields of view and thus behave appropriately due to being aware of the difference between their perceptions. The robot estimates the orientation of the user's head and the structure of its surrounding environment using a stereo camera. By combining these results, it can inform itself of the user's and its own fields of view: that is, what they can see and what they cannot see. Next, we carry out experimental subjective evaluations of the impressions that people gain during interaction with the proposed robot. Participants who observe the interactions are asked to subjectively evaluate their impressions of the robot's behaviors. The experimental results show that the proposed robot, which can guess what the user can see and understand the differences between their different viewpoints, is perceived as more "companionable." This ability is likely to be one of the basic requirements for achieving interactions that people interpret as "friendly" with robots and other intelligent systems.
Scientific journal, English - Face and expression recognition based on bag of words method considering holistic and local image features
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
IEEE 10th International Symposium on Communications and Information Technologies 2010 (ISCIT2010), WM1-1-1, Oct. 2010, Peer-reviwed
International conference proceedings, English - Face and expression recognition based on bag of words method considering holistic and local image features
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
Proc. of IEEE 10th International Symposium on Communications and Information Technologies 2010 (ISCIT2010), WM1-1-1, Oct. 2010, Peer-reviwed
International conference proceedings, English - Development of robot which recognizes user’s false beliefs using view estimation
Jun-ichi Imai; Masahide Kaneko
Proceedings of the World Automation Congress (WAC 2010), ISORA(International Symposium on Robotics and Applications)Track, 178, Sep. 2010, Peer-reviwed
International conference proceedings, English - Kansei evaluation of behaviors of robot which recognizes difference between user’s and its own fields of view
Jun-ichi Imai; Masahide Kaneko
KEER2010 (International Conference on Kansei Engineering and Emotion Research 2010), 683-692, Mar. 2010, Peer-reviwed
International conference proceedings, English - Facial expression recognition using facial-component-based bag of words and PHOG descriptor
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
映像情報メディア学会誌, 64, 2, 230-236, Feb. 2010, Peer-reviwed
Scientific journal, English - Robust face recognition using block-based bag of words
Zisheng Li; Jun-Ichi Imai; Masahide Kaneko
Proceedings - International Conference on Pattern Recognition, TuAT9.41, 1285-1288, 2010, Peer-reviwed, A novel block-based bag of words (BBoW) method is proposed for robust face recognition. In our approach, a face image is partitioned into multiple blocks, dense SIFT features are then calculated and vector quantized into different codewords on each block respectively. Finally, histograms of codeword distribution on each local block are concatenated to represent the face image. Experimental results on AR database show that only using one neutral expression frame per person for training, our method can obtain excellent face recognition results on face images with extreme expressions, variant illumination, and partial occlusions. Our method also achieves an average recognition rate of 100% on XM2VTS database. © 2010 IEEE.
International conference proceedings, English - Face alignment based on statistical models using SIFT descriptors
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
IEICE Trans. on Fundamentals (Special Section on Image Media Quality), E92-A, 12, Dec. 2009, Peer-reviwed
Scientific journal, English - 顔印象の定量的記述と類似顔検索への応用
高橋秀政; 今井順一; 金子正秀
日本顔学会誌, 9, 1, 119-129, Oct. 2009, Peer-reviwed
Scientific journal, Japanese - Facial-component-based Bag of Words and PHOG Descriptor for Facial Expression Recognition
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
2009 IEEE International Conference on Systems, Man, and Cybernetics (SMC2009), P0591, Oct. 2009, Peer-reviwed
International conference proceedings, English - Facial feature localization using statistical models and SIFT descriptors
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
IEEE RO-MAN 2009 (18th IEEE International Symposium on Robot and Human Interactive Communication), ThB2.4, Oct. 2009, Peer-reviwed
International conference proceedings, English - Online object modeling method for occlusion-robust tracking
Jun-ichi Imai; Wei-ming Li; Masahide Kaneko
IEEE RO-MAN 2009 (18th IEEE International Symposium on Robot and Human Interactive Communication), TuIAH.11, Sep. 2009, Peer-reviwed
International conference proceedings, English - 撮影条件の違いに対応可能なまばたき検出を利用したベストショット画像の自動生成
尾崎勇也; 今井順一; 金子正秀
映像情報メディア学会誌, 62, 11, 1825-1832, Nov. 2008, Peer-reviwed
Scientific journal, Japanese - 顔パーツの形状特徴と配置の型を考慮した類似顔検索
金澤慧; 今井順一; 金子正秀
日本顔学会誌, 8, 1, 97-108, Oct. 2008, Peer-reviwed
Scientific journal, Japanese - Human-Robot Interaction with View Estimation in Occlusion Environments
Jun-ichi Imai; Masahide Kaneko
Proc. of Joint 4th International Conference on Soft Computing and Intelligent Systems and 9th International Symposium on Advanced Intelligent Systems(SCIS&ISIS2008), 1281-1286, SA-D2-3, Sep. 2008, Peer-reviwed
International conference proceedings, English - Visual tracking in occlusion environments by autonomous switching of targets
Jun-ichi Imai; Masahide Kaneko
IEICE Trans. Inf. & Syst., E91-D, 1, 86-95, Jan. 2008, Peer-reviwed
Scientific journal, English - Understanding Human Action in Daily Life Scene based on Action Decomposition using Dictionary Terms and Bayesian Network
Juanda Lokman; Jun-ichi Imai; Masahide Kaneko
PROCEEDINGS OF THE SECOND INTERNATIONAL SYMPOSIUM ON UNIVERSAL COMMUNICATION, IEEE COMPUTER SOC, 67-74, 2008, Peer-reviwed, In this paper we propose a novel approach for understanding human actions in daily life scene by decomposing the human motions into actions primitive using the definition of the motion verb in Dictionary and representing the relationship of the action words using Bayesian Network. Because there are so many variant of human motions and the difficulty in naming the human motion in daily life, we propose to use the word definition in dictionary in order to give the appropriate vocabulary for the actions and modeling the human actions. In this method, we can decompose the human actions into smaller primitive motions and give a name to each motion according to the definition from the dictionary. Another advantage of this method is that we can use only small. amount of training data for the smallest primitive motion that can be related directly with the features from the image or sequence of images and by incorporating some predefined knowledge. We implement the proposed methods to recognize several human actions in daily life which can be divided into 3 categories : action without object or interaction with other human (e.g., walking, sitting, etc.), action with object (e.g., grasping, picking up, etc.), and action which interact with other human (e.g., shaking hands, etc.). We shows the proposed method can be used to recognize actions in daily life by inferring the Bayesian Network based on the evidence(s) from input images sequence.
International conference proceedings, English - 顔特徴の主成分分析に基づく似顔絵をインタフェースとした顔画像データベース検索
小林聖治; 今井順一; 金子正秀
日本顔学会誌, 7, 1, 77-88, Sep. 2007, Peer-reviwed
Scientific journal, Japanese - 階層的分類手法を利用した顔印象語と顔部品形状との対応付け
佐藤夕介; 今井順一; 金子正秀
日本顔学会誌, 7, 1, 89-99, Sep. 2007, Peer-reviwed
Scientific journal, Japanese - 全周方向での音源位置推定および肌色情報との統合による話者位置推定への適用
高橋哲史; 今井順一; 金子正秀
電子情報通信学会論文誌D, J90-D, 8, 2232-2241, Aug. 2007, Peer-reviwed
Scientific journal, Japanese - Estimation of robot’s and user’s views and blind regions in occlusion environments
Jun-ichi Imai; Masahide Kaneko
IEEE RO-MAN2007 (16th IEEE International Symposium on Robot & Human Interactive Communication, TB1-4, 528-533, Aug. 2007, Peer-reviwed
International conference proceedings, English - Location-based tracking of moving obstacles from a mobile robot
Thatsaphan Suwannathat; Jun-ichi Imai; Masahide Kaneko
Proc.of MVA2007, Paper Number 3-13, May 2007, Peer-reviwed
International conference proceedings, English - Omni-directional audio-visual speaker detection for mobile robot
Thatsaphan Suwannathat; Jun-ichi Imai; Masahide Kaneko
2007 RO-MAN: 16TH IEEE INTERNATIONAL SYMPOSIUM ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION, VOLS 1-3, IEEE, 141-144, 2007, Peer-reviwed, Tracking humans' position is a useful skill for the coming generation of mobile robot. It is a challenging problem of planning and control in dynamic environment. We propose the onmi-directional estimation method of speaker's position using the combination of audio and visual information. Estimation of the position of the sound is carried out to calculate the difference of arrival time from sound source to multi-channel microphones. The robust human template matching on the onmi-directional image is employed to combine the result of sound source estimation to realize a highly accurate estimation of speaker's location. In our experiments, the systems were implemented and tested on an onmi-directional robot at our laboratory. The results show that we are able to reliably detect and track moving objects in natural environment.
International conference proceedings, English - Behavior selection of mobile robot based on integration of multimodal information
Bin Chen; Masahide Kaneko
ELECTRICAL ENGINEERING IN JAPAN, SCRIPTA TECHNICA-JOHN WILEY & SONS, 158, 2, 39-48, Jan. 2007, Recently, biologically inspired robots have been developed to acquire the capacity for directing visual attention to salient stimulus generated from the audiovisual environment. For the purpose of realizing this behavior, a general method is to calculate saliency maps to represent how much the external information attracts the robot's visual attention, where the audiovisual information and robot's motion status should be involved. In this paper, we represent a visual attention model where three modalities-audio information, visual information, and robot's motor status are considered, because previous research has not considered all of them. First, we introduce a 2D density map, on which the value denotes how much the robot pays attention to each spatial location. Then we model the attention density using a Bayesian network where the robot's motion statuses are involved. Next, the information from both audio and visual modalities is integrated with the attention density map in integrate-fire neurons. The robot can direct its attention to the locations where the integrate-fire neurons are fired. Finally, the visual attention model is applied to make the robot select the visual information from the environment, and react to the content selected. Experimental results show that it is possible for robots to acquire the visual information related to their behaviors by using the attention model considering motion statuses. The robot can select its behaviors to adapt to the dynamic environment as well as to switch to another task according to the recognition results of visual attention. (c) 2006 Wiley Periodicals, Inc.
Scientific journal, English - 線形判別分析による表情特徴と顔特徴の分離に基づく似顔絵アニメーションへの表情付け
沙秀; 今井順一; 金子正秀
日本顔学会誌, 6, 1, 99-108, Sep. 2006, Peer-reviwed
Scientific journal, Japanese - Visual object tracking under occlusions with autonomous Switching mechanism of targets
Jun-ichi Imai; Masahide Kaneko
Proceedings of Joint 3rd International Conference on Soft Computing and Intelligent Systems and 7th International Symposium on Advanced Intelligent Systems (SCIS & ISIS 2006), TH-G4-1, 618-623, Sep. 2006, Peer-reviwed
International conference proceedings, English - 顔面の肌色解析による交感神経系活性度の非侵襲的評価
今井順一; 福本誠; 金子正秀; 長島知正
電子情報通信学会論文誌D, J89-D, 8, 1869-1876, Aug. 2006, Peer-reviwed
Scientific journal, Japanese - 顔特徴の印象表現に対する定量的分析と入力顔判別への応用
西野史康; 金子正秀
日本顔学会誌, 5, 1, 91-100, Sep. 2005, Peer-reviwed
Scientific journal, Japanese - 複数の異なるモダリティ情報の統合に基づく移動ロボットの行動選択
陳彬; 金子正秀
電気学会電子・情報・システム(C)部門誌, 125, 5, 765-773, May 2005, Peer-reviwed
Scientific journal, Japanese - Moving Obstacle Detection from Mobile Robot by Adjacent Mean Difference Based Spatial Temporal Entropy
Thatsaphan Suwannathat; Masahide Kaneko
4th Asian Conference on Industrial Automation and Robotics (ACIAR 2005), F-79, pp.159-162, May 2005, Peer-reviwed
International conference proceedings, English - Cooperative Usage of Monocular Camera and Omnidirectional Camera for Segmenting Moving Humans
Thatsaphan Suwannathat; Masahide Kaneko
IAPR Conference on Machine Vision Applications (MVA2005), 13-1, pp.440-443, May 2005, Peer-reviwed
International conference proceedings, English - ベイジアンネットワークに基づく視聴覚情報の統合を用いた画像からの3次元音源位置推定
陳彬; 目黒光彦; 金子正秀
電気学会論文誌C (電子・情報・システム部門誌), 124, 3, 720-728, Mar. 2004, Peer-reviwed
Scientific journal, Japanese - Hierarchical interpretation of composite human motion using constraints on angular pose of each body part
J Lokman; M Kaneko
RO-MAN 2004: 13TH IEEE INTERNATIONAL WORKSHOP ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION, PROCEEDINGS, IEEE, 335-340, 2004, Peer-reviwed, This paper presents a method for interpretation of human motion, particularly concerning with variation of motion for each activity. It analyzes and interprets action of each body part for composite activity in a sequence of poses. By analyzing each of major body parts, it can solve the occlusion problem. The basic idea for this paradigm is summarized as the following three points; (1) human activity does not always employ all the body parts (e.g. only hand(s), leg(s), torso, etc., (2) human can carry out many activities simultaneously, and (3) human only interprets the body parts that can be perceived.
International conference proceedings, English - 固有空間法による顔特徴の分析と印象語に基づく顔画像の生成
金子正秀; 水野友和; 目黒光彦
日本顔学会誌, 3, 1, 63-73, Sep. 2003, Peer-reviwed
Scientific journal, Japanese - 顔姿勢推定に基づくユーザとロボットとの共同注意の形成
陳彬; 目黒光彦; 金子正秀
電気学会論文誌C (電子・情報・システム部門誌), 123, 7, 1243-1252, Jul. 2003, Peer-reviwed
Scientific journal, Japanese - 会話シーンにおけるロボットと複数ユーザとの共同注意の形成
陳彬; 目黒光彦; 金子正秀
映像情報メディア学会誌, 57, 7, 854-863, Jul. 2003, Peer-reviwed
Scientific journal, Japanese - 情景画像からの看板領域および看板文字の自動抽出
傅杭; 長井隆行; 金子正秀; 榑松明
映像情報メディア学会誌, 57, 7, 819-828, Jul. 2003, Peer-reviwed
Scientific journal, Japanese - 室内監視画像からの物体領域の検出と移動履歴の管理
藤井朝子; 目黒光彦; 金子正秀
映像情報メディア学会誌, 57, 7, 868-872, Jul. 2003, Peer-reviwed
Scientific journal, Japanese - ユーザとエージェントロボットとのインタラクションにおける注意の取扱い
陳彬; 目黒光彦; 金子正秀
未来開拓研究「感性的ヒューマンインタフェース」 合宿シンポジウム, May 2003
Japanese - コンピュータによる似顔絵の生成とマルチモーダル擬人化インタフェースに関する研究
日本学術振興会未来開拓学術研究推進事業プロジェクト 理工学領域「感性ヒューマンインタフェース」分野 マルチモーダル擬人化インタフェースとその感性基盤機能 平成14年度研究成果報告書, 28-33, Mar. 2003
Japanese - Probabilistic integration of audiovisual information to localize sound source in human-robot interaction
B Chen; M Meguro; M Kaneko
RO-MAN 2003: 12TH IEEE INTERNATIONAL WORKSHOP ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION, PROCEEDINGS, IEEE, 229-234, 2003, Peer-reviwed, This paper proposes a method to estimate a sound source position by fusing the auditory and visual information with Bayesian network in human-robot interaction. We firstly integrate multi-channel audio signals and a depth. image about the environment to generate a likelihood map for sound source localization. However, this integration, denoted by "MICs", does not always lead to locate a sound source correctly. For correcting the failure in localization, we integrate the likelihood values generated from MICs" and the skin-color distribution in an image according to the result of classifying audio signal into speech/non-speech categories. The audio classifier is based on the support vector machine(SVM) and the skin-color distribution is modeled with GMM. With the evidences given by MICs, SVMs and GMM, we infer whether pixels in images correspond to sound source or not according to the trained Bayesian network. Finally, experimental results are presented to show the effectiveness of the proposed method.
International conference proceedings, English - A new design method of general weighted median filters admitting negative weights for enhancement of images degraded by additive noise
Mitsuhiko Meguro; Masahide Kaneko; Akira Kurematsu
Proceedings of SPIE, vol.5014, Image Processing: Algorithms and Systems II, 5014-45, Jan. 2003, Peer-reviwed
International conference proceedings, English - コンピュータは似顔絵描きになれるか --- コンピュータによる顔特徴の解析と似顔絵の生成 ---
日本顔学会第22回イブニングセミナー資料, 1-3, Dec. 2002
Japanese - Skin-color-based image segmentation and its application in face detection
Quan Huynh-Thu; Mitsuhiko Meguro; Masahide Kaneko
IAPR Workshop on Machine Vision Applications (MVA2002), 3-3, 48-51, Dec. 2002, Peer-reviwed
International conference proceedings, English - 知的画像情報処理とアクティブヒューマンインタフェース ~ 画像を主体としたマルチメディア情報による新たな情報環境の構築 ~
金子正秀; 目黒光彦
電気通信大学研究開発交流会分科会6, 音声処理・画像処理, 7-12, Nov. 2002
Japanese - ユーザとロボットとのインタラクションにおけるアテンションの取扱い --- 視覚・聴覚情報に基づくアテンションの形成と利用 --
陳彬; 目黒光彦; 金子正秀
電気通信大学第2回コミュニケーション科学談話会, Oct. 2002
Japanese - 曖昧さを含んだ時空間指示によるコンピュータとの知的インタラクション
竹内伸吾; 目黒光彦; 金子正秀
情報処理学会論文誌, Information Processing Society of Japan (IPSJ), 43, 10, 3243-3246, Oct. 2002, Peer-reviwed, This paper discusses a human-computer interaction method which is based on the words indicating spatial positions such as "next to that" and "right" and temporal relations such as "recently" and "two or three weeks ago". Most of these words contain ambiguity. In order to handle such ambiguity, this paper utilizes the Fuzzy set to decide the actual spatial area corresponding to each word. Since the variation implied by each of the words such as more "a little" and so on depends on each individual person, the membership function for each word is modified by referring the history of interaction between a user and a computer.
Scientific journal, Japanese - Synthesis of facial caricature using eigenspaces and its applications to humanlike animated agents
Masahide Kaneko; Mitsuhiko Meguro
Seventh Pacific Rim International Conference on Artificial Intelligence (PRICAI-02), Working Notes (WS-3), International Workshop of Lifelike Animated Agents - Tools, Affective Functions, and Applications -, 58-63, Aug. 2002, Peer-reviwed
International conference proceedings, English - マイクロホンアレーを用いた話者位置推定による車載音声認識
近藤啓介; 長井隆行; 金子正秀; 榑松明
電子情報通信学会論文誌D-II, Vol.J85-D-II, 7, 1176-1187, Jul. 2002, Peer-reviwed
Scientific journal, Japanese - 少数の実写画像に基づく擬似3次元シーンの自動生成
杉山慎; 目黒光彦; 金子正秀
映像情報メディア学会誌, 56, 4, 643-646, Apr. 2002, Peer-reviwed
Research institution, Japanese - Skin-color extraction in images with complex background and varying illumination
Q Huynh-Thu; M Meguro; M Kaneko
SIXTH IEEE WORKSHOP ON APPLICATIONS OF COMPUTER VISION, PROCEEDINGS, IEEE COMPUTER SOC, 280-285, 2002, Peer-reviwed, A skin-color extraction algorithm is proposed to detect human faces in color images with varying illumination condition and presence of complex background. The approach is based on both a Gaussian mixture model of human skincolor distribution and image segmentation using an automatic and adaptive multi-thresholding technique. Detected regions are then refined by morphological operations. Experimental results on images presenting a wide range of variations in lighting condition, face orientation, scale, pose, facial expression and background, demonstrate the efficiency of our skin-segmentation algorithm. Using additional information about facial features, our method becomes an efficient step in localizing candidate faces for a face detection system.
International conference proceedings, English - 研究室紹介 音声・画像情報による新しいインテリジェントシステムに向けて
榑松明; 金子正秀
電気通信大学学園だより, 186, 14-15, Sep. 2001
Research society, Japanese - 固有空間を利用した計算機による似顔絵の生成
徐光哲; 金子正秀; 榑松明
電子情報通信学会論文誌D-II, Vol.J84-D-II, 7, 1279-1288, Jul. 2001, Peer-reviwed
Scientific journal, Japanese - Estimation of speaker's location using 2-D MUSIC and its application to car speech recognition
Takayuki Nagai; Keisuke Kondo; Masahide Kaneko; Akira Kurematsu
Proc. of HSC 2001 (International Workshop on Hands-Free Speech Communication), Kyoto, Japan, 163-166, Apr. 2001, Peer-reviwed
International conference proceedings, English - MPEG符号化されたサッカー映像に対するシーンの自動分類のための情報抽出
玄蕃一輝; 金子正秀; 榑松 明
映像情報メディア学会誌, 55, 3, 417-421, Mar. 2001, Peer-reviwed
Scientific journal, Japanese - コンピュータによる似顔絵の生成と擬人化インタフェースへの応用
日本学術振興会未来開拓学術研究推進事業プロジェクト 理工学領域「感性ヒューマンインタフェース」分野,マルチモーダル擬人化インタフェースとその感性基盤機能,平成12年度研究成果報告書, 19-21, Mar. 2001
Japanese - Estimation of source location based on 2-D MUSIC and its application to speech recognition in cars
T Nagai; K Kondo; M Kaneko; A Kurematsu
2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I-VI, PROCEEDINGS, IEEE, 5, 3041-3044, 2001, Peer-reviwed, This paper proposes a speech recognition and an enhancement system for noisy car environments based on a microphone array. In the system, multiple microphones are arranged in 2-dimensional space, surrounding the interior of a car, and the speaker's location is first estimated by our proposed HE (Harmonic Enhanced) 2-D MUSIC (MUltiple SIgnal Classification). Then, 2-D Delay and Sum (DS) is applied to enhance the target speech. Such pre-processing makes robust speech recognition in noisy car environments possible. In the proposed system, not only a driver, but also a fellow passenger can control car electronics by their voices no matter where they axe. This is an advantage of the system as well.
The results of the simulation and the preliminary experiment in a real car environment axe presented to confirm the validity of our proposed system.
International conference proceedings, English - Generalized unequal length lapped orthogonal transform for subband image coding
Takayuki Nagai; Masaaki Ikehara; Masahide Kaneko; Akira Kurematsu
IEEE Trans. on Signal Processing, 48, 12, 3365-3378, Dec. 2000, Peer-reviwed
Scientific journal, English - 限定された2次元画像情報からの3次元空間の擬似的再構成に関する研究
電気通信普及財団研究調査報告書, 98-01090, 15, 599-609, Dec. 2000
Japanese - マルチモーダル擬人化インタフェースとその感性基盤機能
石塚 満; 橋本周司; 森島繁生; 小林哲則; 金子正秀; 相澤清晴; 苗村 健; 伊庭斉志; 土肥 浩
感性的ヒューマンインタフェース公開シンポジウム資料,2000.11.22, 99-111, Nov. 2000
Japanese - Speech recognition and enhancement in cars using estimation of speaker's position by 2-D MUSIC method
Keisuke Kondo; Takayuki Nagai; Masahide Kaneko; Akira Kurematsu
Proc. of SPAT2000(The 2nd International Workshop on Signal Processing Applications and Technology),S6-3, Tokyo, Japan, 156-159, Oct. 2000, Peer-reviwed
International conference proceedings, English - 知的コミュニケーションのための顔画像処理
日本機械学会No.00-57講習会「安全を支え,新機能を創出するバイオメトリクス―人を見る,賢い機械システム,インテリジェント人工環境―」教材, 47-58, Oct. 2000
Japanese - 画像を主体としたマルチメディア情報による新たな情報環境の構築
金子正秀; 目黒光彦
電気通信大学フォーラム2000 研究開発交流会(「中小企業総合事業団研究開発交流促進事業」)講演予稿集,分科会C2, Oct. 2000
Japanese - 話者位置推定を用いた車載音声認識・強調システム
榑松 明; 金子正秀; 長井隆行
電気通信大学フォーラム2000 研究開発交流会(「中小企業総合事業団研究開発交流促進事業」)講演予稿集,分科会C2, Oct. 2000
Japanese - 図書紹介:C言語で学ぶ実践画像処理―Windows / Macintosh / X-Window対応―
電子情報通信学会誌, 83, 5, 396, May 2000
Japanese - 少数の2次元画像からの3次元的なウォークスルーの実現
杉山 慎; 金子正秀; 滝嶋康弘
電気通信大学共同研究センター 第5回共同研究成果発表会論文集, 1-2, May 2000
Japanese - 顔部品の形状と配置と傾きの特徴に着目した計算機による似顔絵の生成
日本学術振興会未来開拓学術研究推進事業プロジェクト 理工学領域「感性ヒューマンインタフェース」分野,マルチモーダル擬人化インタフェースとその感性基盤機能,平成11年度研究成果報告書, 12-14, Mar. 2000
Japanese - 会議レポート IMPS99/PCSJ99
映像情報メディア学会誌, 53, 12, 1696, Dec. 1999
Japanese - Analysis and synthesis of 3-D face image sequence based on model-based image coding scheme with an internet browser
Min Chul Park; N. P. Chandrasiri; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of 1999 International Conference on Image Processing(ICIP '99), Kobe, Japan, 28AP1.5, 4, 207-211, Oct. 1999, Peer-reviwed
International conference proceedings, English - A steganographic and cryptographic scheme in model-based image coding and face animation
Min Chul Park; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of 1999 International Workshop on Very Low Bitrate Video Coding(VLBV '99), Kyoto, Japan, 117-120, Oct. 1999, Peer-reviwed
International conference proceedings, English - Synthesis of facial caricatures using eigenspaces and its applications to communication
GuangZhe Xu; Masahide Kaneko; Akira Kurematsu
Proc. of 1999 International Workshop on Very Low Bitrate Video Coding(VLBV '99), Kyoto, Japan, 192-195, Oct. 1999, Peer-reviwed
International conference proceedings, English - 少数の2次元画像からの3次元的なウォークスルーの実現
金子正秀; 滝嶋康弘
電気通信大学共同研究センター 第4回共同研究成果発表会論文集,1999.5.28, 1-2, May 1999
Japanese - Compression and representation of 3-D images
T Naemura; M Kaneko; H Harashima
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E82D, 3, 558-567, Mar. 1999, Peer-reviwed, This paper surveys the results of various studies oil 3-D image coding. Themes are focused on efficient compression and display-independent representation of 3-D images, Most of the works on 3-D image coding have been concentrated on the compression methods tuned for each of the 3-D image formats (stereo pairs, multi-view images, volumetric images, holograms and so on). For the compression of stereo images, several techniques concerned with the concept of disparity compensation have been developed. For the compression of multi-view images, the concepts of disparity compensation and epipolar plane image (EPI) are the efficient ways of exploiting redundancies between multiple views. These techniques, however, heavily depend on the limited camera configurations. In order to consider many other multi-view configurations and other types of 3-D images comprehensively, more general platform for the 3-D image representation is introduced, aiming to outgrow the framework of 3-D "image" communication and to open up a novel held of technology, which should be called the "spatial" communication. Especially, the light ray based method has a wide range of application, including efficient transmission of the physical world, as well as integration of the virtual and physical worlds.
Scientific journal, English - Processing of face images and its applications
M Kaneko; O Hasegawa
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E82D, 3, 589-600, Mar. 1999, Peer-reviwed, Human faces convey various information, including that is specific to each individual person and that is part of mutual communication among persons. Information exhibited by a "face" is what is called "non-verbal information" and usually verbal media cannot easily describe such information appropriately. Recently, detailed studies on the processing of face images by a computer have been carried out in the engineering field for applications to communication media and human computer interaction as well as automatic identification of human faces. Two main technical topics are the recognition of human faces and the synthesis of face images. The objective of the former is to enable a computer to detect and identify users and further to recognize their facial expressions, while that of the latter is to provide a natural and impressive user interface:on a computer in the form of a "face." These studies have also been found to be useful in various non-engineering fields related to a face, such as psychology, anthropology, cosmetology and dentistry. Most of the studies in these different fields have been carried out independently up to now, although all of them deal with a "face." Now in virtue of the progress in the above engineering technologies a common study tools and databases for facial information have become available.
On the basis of these backgrounds, this paper surveys recent research trends in the processing of face images by a computer and its typical applications. Firstly, the various characteristics of faces are considered. Secondly, recent research activities in the recognition and synthesis efface images are outlined. Thirdly, the applications of digital processing methods of facial information are discussed from several standpoints: intelligent image coding, media handling, human computer interaction, caricature, facial impression, psychological and medical applications. The common tools and databases used in the studies of processing of facial information and some related topics are also described.
Scientific journal, English - Advanced model-based image coding scheme
Min Chul Park; Takeshi Naemura; Masahide Kaneko; Haroshi Harashima
ISSPA 1999 - Proceedings of the 5th International Symposium on Signal Processing and Its Applications, IEEE Computer Society, 2, 2, 817-820, 1999, Peer-reviwed, Studies on 3-D model-based image coding have concentrated on facial image sequences to implement low-bit rate communication and other applications. In this paper, this scheme is extended by including human-computer interfaces through the recognition of facial gestures and interactive control of a face object on an Internet browser, and by digital watermarking. Human faces or faces of anthropomorphic agents are synthesized with the real and/or recognized facial motion on an Internet browser using virtual reality modeling language(VRML). Digital watermarking is employed to prevent real face images from unwanted use and copyright infringement. By extending previous model-based image coding schemes for facial image sequences, an interactive, effective, safe and low-bit rate communication can be carried out. Experimental results show the usefulness and effectiveness of the proposed scheme. © 1999 IEEE.
International conference proceedings, English - Orthographic approach to representing 3-D images and interpolating light rays for 3-D image communication and virtual environment
T Naemura; M Kaneko; H Harashima
SIGNAL PROCESSING-IMAGE COMMUNICATION, ELSEVIER SCIENCE BV, 14, 1-2, 21-37, Nov. 1998, Peer-reviwed, First, this paper explains the concept of the 'Integrated 3-D Visual Communication System', aiming to realize a display-independent method for representing 3-D scenes/objects. This concept will promote the progress of 3-D image communication systems, while several 3-D display technologies are making rapid progress. Secondly, a ray-based method is developed as a fundamental approach to realize this concept, and three types of parameterization of light rays are formulated. The main proposal of this paper is the utilization of orthographic views, which are neutral for any input and output system. Once a set of orthographic views of a 3-D scene/object is obtained, we can synthesize its any perspective view while viewing it from within a visual zone. Thirdly, in order to enhance the visual effects, a method for interpolating light rays is also proposed. In this method, structural properties, estimated from input images, are utilized. The advantage of the proposed method is that the visibility of estimation errors of structural properties is effectively suppressed in the synthesized views. Experimental results show the potential applicability of the proposed method to the next-generation 3-D image communication and virtual reality systems. (C) 1998 Elsevier Science B.V. All rights reserved.
Scientific journal, English - Applied processing of referential frames in facial image sequence
Min Chul Park; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
International Workshop on Coding Techniques for Very Low Bit-rate Video(VLBV '98), 93-96, Oct. 1998, Peer-reviwed
International conference proceedings, English - 3-D Space Coding Based on Light Ray Data…Local Expansion of Compressed Light Ray Data…
高野孝英; 苗村 健; 金子正秀; 原島 博
The Journal of the Institute of Image Information and Television Engineers, 52, 9, 1321-1327, Sep. 1998, Peer-reviwed
Scientific journal, Japanese - Ray-based Rendering for Virtual Light Sources
苗村 健; 金子正秀; 原島 博
The Journal of the Institute of Image Information and Television Engineers, 52, 9, 1328-1335, Sep. 1998, Peer-reviwed
Scientific journal, Japanese - 逐次的カメラ制御による光線情報の効率的サンプリング
村上智一; 苗村 健; 金子正秀; 原島 博; 市川忠嗣
映像情報メディア学会誌, The Institute of Image Information and Television Engineers, 52, 9, 1366-1369, Sep. 1998, Peer-reviwed, あらまし3次元空間における膨大な光線情報に対して, 1台のカメラの位置を逐次的に制御しながら光線情報を効率的にサンプリングする手法を提案する.すでに取得された光線情報から3次元空間がどの程度正確に補間合成され得るかを予測し, 補間が困難な視点位置から優先的に光線情報を取得する.実際に視点探索の実験を行い、本手法の実現可能性を示す.
Scientific journal, Japanese - Detection of Local Motion Parameters and Processing of Eye-glasses in Interactive Model-based Coding of Facial Image Sequence
大関和夫; 齋藤隆弘; 金子正秀; 原島 博
Transaction of Information Processing Society of Japan, Information Processing Society of Japan (IPSJ), 39, 7, 2134-2148, Jul. 1998, Peer-reviwed, For interactive model-based coding of facial image sequence, the number of interactive operations and difficulty of procedures should be clarified. This paper develops a local motion detection tool which realizes encoding in a limited number of operations with practically easy operations. A comparison of description order between local motion and global motion is examined from the viewpoint of amount of operations, Hierarchical and cooperative moving rule of vertices on wireframe model around facial part is proposed. By introducing zero-th and the 1-st order periodic waveform pattern for both horizontal edges of mouth, the number of operations for local motion is reduced. Extending the developed tool to the processing of eye-glass frame, new problems are found to be analyzed. Eye-glasses which overwrites glass frame by skin color is compared with a method using separated input of eye-glasses. A new deciding criterion for terminating human operation of eye-glasses processing is developed. The total encoding tool is fully practical and many facial image sequences are well encoded by the authors and others engineers.
Scientific journal, Japanese - Interactive Operation on 3-D Real Images Using Ray Description
石川彰夫; 苗村 健; 金子正秀; 原島 博
IEICE Transactions D-II, The Institute of Electronics, Information and Communication Engineers, J81-D-II, 5, 850-860, May 1998, Peer-reviwed, 3次元画像通信において, 3次元画像に対する記述方式は, 個別の3次元入出力方式から独立した中立的なものであることが望ましい.このような観点から, 筆者らは, 光線に基づいた3次元画像情報の記述方法として, 「光線空間」の概念を提案している.本論文では, 「光線空間」の概念に基づき, 3次元物体と空間とを同時に記述する新しい手法, ならびに, 実写情報によって構成される空間を計算機上でインタラクティブに操作する方法について述べる.実空間内の任意の視点から眺めた風景画像の合成は, 視点位置情報に基づいて光線空間から, ある基本式で記述された曲面上の光線情報を切り出すことに相当する.本論文では実時間処理を目的としており, 効率的な光線情報の切出しを行うために参照テーブルを用いることにした.また, 空間の光線情報に3次元物体の光線情報を上書きすることによって, 空間の中にほぼ実時間で仮想的に実物体を配置する実験も行った.実験の結果, 提案手法によって実写ベースの3次元空間情報の記述ならびに操作を効率的に行えることが明らかになった.
Scientific journal, Japanese - Collaborative CyberMirage:リアリティと相互アウェアネスを追求した仮想空間共有体験システム
片山昭宏; 内山晋二; 熊谷 篤; 田村秀行; 苗村 健; 金子正秀; 原島 博
情報処理学会論文誌, 39, 5, 1484-1493, May 1998, Peer-reviwed
Scientific journal, Japanese - Interactive Command Coding of Moving Image Sequence using its Semantic Structure Indicated through User Interactions
太田善之; 金子正秀; 原島 博
IEICE Transactions D-II, The Institute of Electronics, Information and Communication Engineers, J81-D-II, 4, 735-743, Apr. 1998, Peer-reviwed, ユーザが対話的な操作を介して符号化プロセスに積極的に関与し, 動画像の主題に沿って画像を構造化するインタラクティブコマンド符号化について述べる.本符号化手法では, 形状・テクスチャ・動きに関する物体の特徴をユーザの対話的な操作によって抽出し, 原画像の主題に沿って詳細に記述する手法から簡素化して記述する手法までの中から適宜の手法を割り当てることによって, 低ビットレートにおいても原画像の主題を優先して伝えることができる.更に, 動きに対するパラメータを変更したり, 特徴記述手法を別の手法に変更することによって, 復号側において概略把握のためのブラウジングを容易にしたり, ノンリニア画像編集にも容易に応用することができる.これらの考え方について, 具体的な実験例を含めて説明する.
Scientific journal, Japanese - 光線情報取得のための多眼カメラパラメータの同時推定
馬場健介; 苗村 健; 金子正秀; 原島 博
映像情報メディア学会誌, The Institute of Image Information and Television Engineers, 52, 3, 345-355, Mar. 1998, Peer-reviwed, This paper proposes a method of estimating multiview camera parameters for cases in which the structure of objects is unknown. The proposed method uses multiple rectangles in the 2-D images captured with the same focal length as the keys to estimate camera parameters. In this method, the 3-D coordinates of rectangles are first estimated from all images by using the characteristic of rectangles and the least squares method. Then, all camera parameters are estimated by using the estimated 3-D coordinates of rectangles and the least squares method. Finally, all parameters, that is, 3-D coordinates of rectangles and camera parameters, are corrected to minimize the errors in all images. Experimental results show that the proposed method gives good estimations of the multiview camera parameters required to obtain ray information for cases in which the shape of objects is unknown. This means that ray information can be acquired by using one ordinary camera instead of a special camera controlled by computer.
Scientific journal, Japanese - Priority and segmentation algorithm for the 3-D motion estimation of two heads partly overlapped
MC Park; M Kaneko; H Harashima; T Naemura
AUTOMATIC FACE AND GESTURE RECOGNITION - THIRD IEEE INTERNATIONAL CONFERENCE PROCEEDINGS, IEEE COMPUTER SOC, 597-602, 1998, Peer-reviwed, Though many passive sensing methods have been presented on the analysis of 3-D facial motion, generally those methods are useful only when the motion of a single face is analyzed. This paper presents an efficient method to analyze 3-D head motions of two faces in the scene even when the areas of two faces are partly overlapped. To solve the problem which comes from overlapping of facial areas, PriSe(Pri-ority and Se-gmentation) algorithm with the GRIP method[1][2] is newly suggested in this paper. With our proposed method, 3-D head motions of two faces can be stably analyzed at the same time even though some part of faces are overlapped. Preliminary experiments for a series of real and synthesized image sequences show the effectiveness of the proposed method with the sufficient accuracy to analyze two facial motions in 3-D space.
International conference proceedings, English - Precision of Global Motion Parameter Detection in Interactive Semantic/Model-Based Image Coding
Kazuo Ohzeki
Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, Inst. of Image Information and Television Engineers, 52, 6, 871-880, 1998, Peer-reviwed, Video network is beginning to have various kinds of applications such as using a vertical blanking interval. Model-based coding is suitable for the narrow band network. Interactive model-based image coding, which had been developed for non-realtime environment, needs to be specified by the number and the precision of interactive operations. This paper first analyzes the noise in input feature points during the global motion parameter detection. Then a new structure filter for reducing the noise in the feature points on a facial wireframe model is developed. The structure filter keeps original facial shape composed of feature points and reduces variation in the mutual distance between the feature points. In evaluating the precision for applying the least-squares method for detecting depth and global motion parameters, the number of conditions of input data is considered from the point of variance of error of the estimated values. Based on the structure filter with the precision evaluation, the allowance error in the interactive operation for the encoding process is specified by the pixel accuracy for feature point position.
Scientific journal, Japanese - Multi-user immersive stereo
T Naemura; M Kaneko; H Harashima
1998 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING - PROCEEDINGS, VOL 1, IEEE COMPUTER SOC, I, 903-907, 1998, Peer-reviwed, Recently, multi-screen projection systems are widely used in the field of virtual reality. Within the system bounded by screens, users can view the panoramic stereoscopic images projected onto the screens. In such an immersive environment, however just one viewer can feel the natural depth sensation. la this paper the authors propose a novel approach to realize a multi-user system, in which several users can feel the adequate depth sensation simultaneously. Experimental results show the potential applicability of the proposed method to the next-generation virtual environment.
International conference proceedings, English - Efficient Representation of 3-D Spatial Data Based on Orthogonal Projection of Ray Data Samples
苗村 健; 金子正秀; 原島 博
The Journal of the Institute of Image Information and Television Engineers, The Institute of Image Information and Television Engineers, 51, 12, 2082-2089, Dec. 1997, Peer-reviwed, First, this paper introduces the concept of "Integrated 3-D Visual Communication". The key feature in this concept is the display-independent neutrality and flexibility of the representation of visual data. Secondly, a ray-based approach is examined in order to realize this concept. The advantage of a ray-based approach is that any view can be synthesized from ray data independently of any geometric representations. All the visual data is represented by a set of ray data which is defined in five-dimensional data space. Assuming that rays go straight on without any variations in the direction of propagation, any individual ray data can be efficiently stored in the fewer dimensions. This paper proposes and formulates three methods for projecting five-dimensional data space onto a space with fewer dimensions. The experimental results show how the proposed methods could be used in the next-generation 3-D image communication and photo-realistic virtual reality systems.
Scientific journal, Japanese - Low bitrate video coding method using planar representation with multi-frame maps
上田剛弘; 金子正秀; 齊藤隆弘; 原島 博
IEICE Transactions D-II, The Institute of Electronics, Information and Communication Engineers, J80-D-II, 12, 3117-3126, Dec. 1997, Peer-reviwed, 動画像のレイヤ表現は, アニメーションのセル画のように分割された領域ごとのレイヤマップを, 奥行きの順序に従って重ね合わせた上で相互に動かすことにより動画像を表現する手法である. 従来のレイヤ表現を用いた符号化手法は, 背景等の変化の小さい領域については効率良く表現できるが, 人物のようなテクスチャや形状が変化する非剛体領域等に対して適用することが困難であった. 本論文では, 各領域に対して動画像の時間軸方向での分割を行った上で, 複数フレームのマップを混合して動画像を再構成することにより, 非剛体領域等に対してレイヤ表現を用いて効率良く符号化する手法について述べる. また, 3次元情報が扱えるようにレイヤ表現を拡張したセッティング表現も組み合わせることにより, 符号化効率が向上することを示す. 提案手法では空間方向のみならず時間軸方向の画質制御も容易に行うことが可能で, こま落しのない滑らかな動画像を再現することができる. 最後に, 32 kbit/s 以下の低ビットレートにおいて従来の波形近似に基づく手法(H.263)による符号化結果と比較し, 提案手法の方が視覚的に良好な符号化結果が得られることを明らかにする.
Scientific journal, Japanese - 距離・色データを用いた3次元物体の光線データ取得
竹内敬亮; 苗村 健; 金子正秀; 原島 博
映像情報メディア学会誌, 51, 12, 2090-2096, Dec. 1997, Peer-reviwed
Scientific journal, Japanese - Interaction with virtual space using real-time gesture recognition
Tsuyoshi Kimura; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of ICAT'97 (International Conference on Artificial Reality and Tele-existence), 216-223, Dec. 1997, Peer-reviwed
International conference proceedings, English - Efficient sampling of 3-D spatial data using a computer-controlled camera gantry
Tomokazu Murakami; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of ICAT'97 (International Conference on Artificial Reality and Tele-existence), 184-191, Dec. 1997, Peer-reviwed
International conference proceedings, English - CGモデルと光線空間データとの融合による仮想環境の実現
片山昭宏; 内山晋二; 田村秀行; 苗村 健; 金子正秀; 原島 博
電子情報通信学会論文誌D-II, J80-D-II, 11, 3048-3057, Nov. 1997, Peer-reviwed
Scientific journal, Japanese - Digital processing of facial information
Masahide Kaneko; Hiroshi Harashima
Proc. of 1997 Japan-China Symposium on Signal Processing (JCSSP-97), 53-62, Nov. 1997, Peer-reviwed
International conference proceedings, English - 3次ベジエ曲面チューブを用いた時空間領域画像の記述
内堀克則; 苗村 健; 金子正秀; 原島 博
映像情報メディア学会誌, 51, 10, 1688-1695, Oct. 1997, Peer-reviwed
Scientific journal, Japanese - Recognition of facial gestures using the GRIP method for head motion estimation and hidden Markov models, paper number 861
Min Chul Park; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of 1997 International Conference on Image Processing (ICIP'97), 3, Oct. 1997, Peer-reviwed
International conference proceedings, English - Acquisition of object-based ray data for integrated 3-D visual communication
Keisuke Takeuchi; Masahide Kaneko; Hiroshi Harashima
Proc. of 1997 Picture Coding Symposium (PCS'97), 681-686, Sep. 1997, Peer-reviwed
International conference proceedings, English - Robust 3-D estimation of facial motion for model-based coding and human interface
Min Chul Park; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of 1997 Picture Coding Symposium (PCS'97), P5.1, 561-566, Sep. 1997, Peer-reviwed
International conference proceedings, English - Facial caricature by computer based on the style of individual human caricaturist
花岡悟一郎; 金子正秀; 原島 博
IEICE Transactions D-II, J80-D-II, 8, 2110-2118, Aug. 1997, Peer-reviwed
Scientific journal, Japanese - Processing of facial information by computer
長谷川修; 森島繁生; 金子正秀
IEICE Transactions A, J80-A, 8, 1231-1249, Aug. 1997, Peer-reviwed
Scientific journal, Japanese - GRIP法を用いた頭部の3次元動き分析
パク ミンチョル; 金子正秀; 原島 博
電子情報通信学会論文誌D-II, J80-D-II, 8, 2138-2151, Aug. 1997, Peer-reviwed
Scientific journal, Japanese - 顔動画像のインタラクティブ知的符号化システム
大関和夫; 齋藤隆弘; 金子正秀; 原島 博
電子情報通信学会論文誌A, J80-A, 8, 1293-1303, Aug. 1997, Peer-reviwed
Scientific journal, Japanese - 平均値を用いた顔印象分析
永田明徳; 金子正秀; 原島 博
電子情報通信学会論文誌A, J80-A, 8, 1266-1272, Aug. 1997, Peer-reviwed
Scientific journal, Japanese - 福笑いモジュールを用いた顔画像のインタラクティブ検索
大場敏文; 金子正秀; 原島 博
電子情報通信学会論文誌D-II, J80-D-II, 8, 2254-2258, Aug. 1997, Peer-reviwed
Scientific journal, Japanese - 顔空間を用いた顔特徴の操作
デロワ オリビエ; 金子正秀; 原島 博
電子情報通信学会論文誌A, J80-A, 8, 1332-1336, Aug. 1997, Peer-reviwed
Scientific journal, Japanese - CyberMirage : Embedding ray based data in VRML world
Shinji Uchiyama; Akihiro Katayama; Hideyuki Tamura; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Video proc. ACM, VRAIS'97 (Virtual Reality Annual International Symposium '97), Mar. 1997, Peer-reviwed
International conference proceedings, English - 平面の3次元配置に基づく動画像の構造利用符号化
上田剛弘; 金子正秀; 齋藤隆弘; 原島 博
電子情報通信学会論文誌D-II, J80-D-II, 2, 487-496, Feb. 1997, Peer-reviwed
Scientific journal, Japanese - 3-D visual data compression based on ray-space projection
Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of SPIE VCIP'97, 3024, 413-424, Feb. 1997, Peer-reviwed
International conference proceedings, English - 確率的なクラスタリングによる初期領域に基づく動きパラメータの推定とセグメンテーション
鄭 且根; 相澤清晴; 齋藤隆弘; 金子正秀; 原島 博
電子情報通信学会論文誌A, J80-A, 1, 248-259, Jan. 1997, Peer-reviwed
Scientific journal, Japanese - Interactive model-based coding for face metaphor user interface in network communications
Kazuo Ohzeki; Masahide Kaneko; Takahiro Saito; Hiroshi Harashima
Proc. of IUI97, 245-248, Jan. 1997, Peer-reviwed
International conference proceedings, English - Ray-based creation of photo-realistic virtual world
T Naemura; T Takano; M Kaneko; H Harashima
INTERNATIONAL CONFERENCE ON VIRTUAL SYSTEMS AND MULTIMEDIA - VSMM'97, PROCEEDINGS, I E E E, COMPUTER SOC PRESS, 59-68, 1997, Peer-reviwed, This paper introduces the concept of ray-based representation of spatial data and proposes a new method for creating the photo-realistic virtual world. In this method, the whole ray data of the world are treated as a set of orthogonal views of scene objects. The advantage of this approach is to allow the synthesis of any perspective view by gathering appropriate ray data from the set of orthogonal views independently of any geometric representation. First, several perspective views of the real world are taken as a set of real ray data, and orthogonal views of the world are synthesized from the captured real ray data. Then, structural models corresponding to each perspective view are locally estimated and adaptively stitched each other in order to interpolate the cracks on the orthogonal views. This approach can avoid the difficulty in estimating a unique structural model of the world.
International conference proceedings, English - Collaborative CyberMirage: A shared cyberspace with mixed reality
S Uchiyama; A Katayama; A Kumagai; H Tamura; T Naemura; M Kaneko; H Harashima
INTERNATIONAL CONFERENCE ON VIRTUAL SYSTEMS AND MULTIMEDIA - VSMM'97, PROCEEDINGS, I E E E, COMPUTER SOC PRESS, 9-18, 1997, Peer-reviwed, This paper describes a virtual reality system called ''Collaborative CyberMirage'', which makes it possible to share photo-realistic virtual environment between multiple points. This system was developed to realize a virtual shopping environment, and although this system is expected to be used through the Internet in a near future, it is based on equipments and networks available now. This paper states about the technics required for virtual shopping, then about the structure of this system, and finally about the methods used to develop it. This system is a largely improved version of the former single-user CyberMirage. In both system, the cyberspace is made by combining image-based data and geometric models to realize superior photo-reality.
International conference proceedings, English - Recent and current research on very low bit-rate video coding in Japan
M Kaneko
IEICE TRANSACTIONS ON COMMUNICATIONS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E79B, 10, 1415-1424, Oct. 1996, Peer-reviwed, This paper presents an overview of research activities in Japan in the field of very low bit-rate video coding. Related research based on the concept of ''intelligent image coding'' started in the mid-1980's. Although this concept originated from the consideration of a new type of image coding, it can also be applied to other interesting applications such as human interface and psychology. On the other hand, since the beginning of the 1990's, research on the improvement of waveform coding has been actively performed to realize very low bit-rate video coding. Key techniques employed here are improvement of motion compensation and adoption of region segmentation. In addition to the above, we propose new concepts of image coding, which have the potential to open up new aspects of image coding, e.g. ideas of interactive image coding, integrated 3-D visual communication and coding of multimedia information considering mutual relationship amongst various media.
Scientific journal, English - 動画像の抽象化索引映像の作成とその応用
奥宮啓司; 金子正秀; 原島 博
テレビジョン学会誌, 50, 10, 1558-1566, Oct. 1996, Peer-reviwed
Scientific journal, Japanese - Interactive model-based coding of facial image sequence with a new motion detection algorithm
Kazuo Ohzeki; Takahiro Saito; Masahide Kaneko; Hiroshi Harashima
IEICE Trans. Commu., E79-B, 10, 1474-1483, Oct. 1996, Peer-reviwed
Scientific journal, English - 3-D layered representation of multiview images based on 3-D segmentation
苗村 健; 柳澤健之; 金子正秀; 原島 博
The Journal of the Institute of Television Engineers of Japan, 50, 9, 1335-1344, Sep. 1996, Peer-reviwed
Scientific journal, Japanese - Handling of 3-D objects using ray space
柳澤健之; 苗村 健; 金子正秀; 原島 博
The Journal of the Institute of Television Engineers of Japan, 50, 9, 1345-1351, Sep. 1996, Peer-reviwed
Scientific journal, Japanese - Interactive model-based coding for multimedia E-mail environment
Kazuo Ohzeki; Masahide Kaneko; Takahiro Saito; Hiroshi Harashima
Proc. of 1996 Picture Coding Symposium (PCS'96), 2, 663-668, Mar. 1996, Peer-reviwed
International conference proceedings, English - 3-D object based coding of multi-view images
Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
Proc. of 1996 Picture Coding Symposium (PCS'96), 459-464, Mar. 1996, Peer-reviwed
International conference proceedings, English - Interactive command coding of moving image sequence --- enhancement of command ---
Yoshiyuki Ohta; Masahide Kaneko; Hiroshi Harashima
Proc. of 1996 Picture Coding Symposium (PCS'96), 1, 215-218, Mar. 1996, Peer-reviwed
International conference proceedings, English - Image sequence coding using abstract index images based on hierarchical representation of scenes
Keiji Okumiya; Masahide Kaneko; Hiroshi Harashima
Proc. of 1996 Picture Coding Symposium (PCS'96), 135-140, Mar. 1996, Peer-reviwed
International conference proceedings, English - Fractal-like video coding with weighted summation
K Bochez; M Kaneko; H Harashima
International conference proceedings, English - 3-D segmentation of multi-view images based on disparity estimation
T Naemura; M Kaneko; H Harashima
International conference proceedings, English - Structural motion segmentation for compact image sequence representation
CK Cheong; K Aizawa; T Saito; M Kaneko; H Harashima
International conference proceedings, English - Representation of 3 D spacial information by rays and its application
Toshiaki Fujii; Masahide Kaneko; Hiroshi Harashima
Terebijon Gakkaishi (Journal of the Institute of Television Engineers of Japan), Inst of Television Engineers of Japan, 50, 9, 1312-1318, 1996, Peer-reviwed, In this paper, we propose a new framework of representing 3-D spacial information by using 'Rays'. We show that this data format includes all the information of the scene viewed from any direction, so that, one view image from an arbitrary viewpoint can be obtained by sampling ray data. We also introduce ray parameter space and examine its characteristics. We give a new definition of visual field and viewing zone and evaluate the amount of ray data in terms of ray parameter space. In addition, we show possible applications of this concept by presenting simulations, including generating an any-viewpoint image and a variable-focused image, synthesizing a real image and a computer-generated image, and compressing a hologram pattern.
Scientific journal, English - Representation of moving images with skewed planes and its application to the video coding
Y Ueda; M Kaneko; T Saito; H Harashima
International conference proceedings, English - TOWARD THE NEW ERA OF VISUAL COMMUNICATION
IEICE TRANSACTIONS ON COMMUNICATIONS, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, E76B, 6, 577-591, Jun. 1993, Peer-reviwed, Recently, studies aiming at the next generation of visual communication services which support better human communication have been carried out intensively in Japan. The principal motive of these studies is to develop new services which are not restricted to a conventional communication framework based on the transmission of waveform signals. This paper focuses on three important key words in these studies; ''intelligent,'' ''real,'' and ''distributed and collaborative,'' and describes recent research activities. The first key word ''intelligent'' relates to intelligent image coding. As a particular example, model-based coding of moving facial images is discussed in detail. In this method, shape change and motion of the human face is described by a small number of parameters. This feature leads to the development of new applications such as very low bit-rate transmission of moving facial images, analysis and synthesis of facial expression, human interfaces, and so on. The second key word ''real'' relates to communication with realistic sensations and virtual space teleconferencing. Among various component technologies, real-time reproduction of 3-D human images and a cooperative work environment with virtual space are discussed in detail. The last key word ''distributed and collaborative'' relates to collaborative work in a distributed work environment. The importance of visual media in collaborative work, a concept of CSCW, and requirements for realizing a distributed collaborative environment are discussed. Then, four examples of CSCW systems are briefly outlined.
Scientific journal, English - Synthesis of moving facial images with mouth shape controlled by text information
金子正秀; 小池 淳; 羽鳥好律
IEICE Transactions D-II, 電子情報通信学会情報・システムソサイエティ, J75-D-II, 2, 203-215, Feb. 1992, Peer-reviwed
Scientific journal, Japanese - Three-dimensional motion estimation of head in model-based coding of moving facial images
小池 淳; 金子正秀; 羽鳥好律
IEICE Transactions B-I, 電子情報通信学会通信ソサイエティ, J74-B-I, 10, 789-798, Oct. 1991, Peer-reviwed
Scientific journal, Japanese - 3次元形状モデルを用いた顔動画像符号化における濃淡及び動き表現の一方法
金子正秀; 小池 淳; 羽鳥好律
テレビジョン学会誌, 45, 10, 1277-1287, Oct. 1991, Peer-reviwed
Scientific journal, Japanese - Coding of facial image sequence based on a 3-D model of the head and motion detection
Masahide Kaneko; Atsushi Koike; Yoshinori Hatori
Journal of Visual Communication and Image Representation, 2, 1, 39-54, 1991, Peer-reviwed, Recently a new type of coding method, called intelligent image coding, or more specifically model-based image coding, has attracted much attention as a basis for future visual communication services. The model-based image coding can be constructed by preparing a 3-D-shape model of an object on both the transmitting and the receiving sides, and by transmitting only information about movement and changes in the shape of this model. This paper discusses the model-based image coding in relation to moving facial images from two major objectives: extraction of motion information from an input image sequence and synthesis of an image sequence with a limited amount of motion information. First, the concept of intelligent image coding and the basic outline of model-based image coding are introduced, and then the procedures for processing the mouth and eyes are discussed. On the transmitting side, a feature-extracted image is obtained by applying a thresholding operation to an input image, and characteristic points which represent the basic shapes of the mouth and eyes are detected on it. On the receiving side, the shape of the 3-D model is modified according to the above results obtained on the transmitting side, and a realistic image is reproduced by assigning appropriate luminance and chrominance information to this model. A method of estimating the 3-D motion of the head is also briefly discussed. Experimental results demonstrate the feasibility of a new type of coding system based on the model-based image coding described in this paper. © 1991.
Scientific journal, English
- ふぉーかす(巻頭言):江戸しぐさの精神をヒューマンインタフェースに!
Mar. 2011, 映像情報メディア学会誌, 65, 3, Japanese, Others - 巻頭言 : 顔動画像の符号化とコンピュータ似顔絵~工学的研究の中で顔をどう見てきたか~
Sep. 2010, 日本顔学会誌, 10, 1, 1-4, Japanese, Others - 察するインタフェースに関する研究
Aug. 2010, TELECOM FRONTIER(SCAT TECHNICAL JOURNAL), 68, 18-31, Japanese, Introduction other - 人間共存型ロボットへの画像認識モジュールの応用
The Robotics Society of Japan, Mar. 2009, 日本ロボット学会誌, 27, 2, 20-142, Japanese, Introduction other, 0289-1824, 10024789613, AN00141189 - 自律移動ロボットによる動的環境の認識
伊藤明久; 今井順一; 金子正秀
28 Feb. 2009, 映像情報メディア学会技術報告, 33, 11, 21-24, 1342-6893, 10025302622 - Estimation of Locations and Types of Multiple Sound Sources Using a Microphone Array
ISHII Michio; IMAI Jun-ichi; KANEKO Masahide
To make robots work in daily living spaces for humans, it is important that a robot can estimate an arrival direction of an interrupting sound and recognize its class. Conventional robots can only recognize a single sound source and simultaneous utterance of multiple speakers supposing the number of speakers in advance. However, they cannot deal with the interrupting sounds and recognize their classes without any prior knowledge. This paper proposes a method for estimating arrival directions of interrupting sounds without any supposition on the number of sound sources, and for recognizing their classes. The effectiveness of the proposed method is shown through experiments with a real robot., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE Technical Report, 33, 11, 33-36, Japanese, 1342-6893, 10025302640 - Generation of Expressive Caricatures by Learning Expression Transformation Rule and Caricaturist's Drawing Style
LI Jie; IMAI Jun-ichi; KANEKO Masahide
Caricatures sometimes impress people more than original photographs. This paper aims to improve the automatic caricature system in [1] by generating more expressive caricatures based on analyzing the features of face images with impressions of ethnicity, gender, and expressions. An eigen space model is set up by the principal component analysis of 2D edge information of faces. Qualitative and quantitative description of differences and importance of principal components of each impression are given by the linear discriminant analysis method. By using Support Vector Machine method, the mixed eigen space is divided into four, that is, Japanese male/female, Caucasian male/female. Towards Japanese male input images, expressions transformations by learning transformation rules between six basic expressions and exaggerated caricatures by the caricaturist are carried out. More expressive caricatures can be drawn and animated by the proposed method., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE Technical Report, 33, 11, 81-84, English, 1342-6893, 10025302707 - Generation of Expressive Caricatures by Learning Expression Transformation Rule and Caricaturist's Drawing Style
LI Jie; IMAI Jun-ichi; KANEKO Masahide
Caricatures sometimes impress people more than original photographs. This paper aims to improve the automatic caricature system in [1] by generating more expressive caricatures based on analyzing the features of face images with impressions of ethnicity, gender, and expressions. An eigen space model is set up by the principal component analysis of 2D edge information of faces. Qualitative and quantitative description of differences and importance of principal components of each impression are given by the linear discriminant analysis method. By using Support Vector Machine method, the mixed eigen space is divided into four, that is, Japanese male/female, Caucasian male/female. Towards Japanese male input images, expressions transformations by learning transformation rules between six basic expressions and exaggerated caricatures by the caricaturist are carried out. More expressive caricatures can be drawn and animated by the proposed method., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE Technical Report, 33, 11, 81-84, English, 1342-6893, 110007227916 - 顔情報処理の研究あれこれ
28 Feb. 2009, 映像情報メディア学会技術報告, 33, 11, 131-138, 1342-6893, 10025302778 - Estimation of Locations and Types of Multiple Sound Sources Using a Microphone Array
ISHII Michio; IMAI Jun-ichi; KANEKO Masahide
To make robots work in daily living spaces for humans, it is important that a robot can estimate an arrival direction of an interrupting sound and recognize its class. Conventional robots can only recognize a single sound source and simultaneous utterance of multiple speakers supposing the number of speakers in advance. However, they cannot deal with the interrupting sounds and recognize their classes without any prior knowledge. This paper proposes a method for estimating arrival directions of interrupting sounds without any supposition on the number of sound sources, and for recognizing their classes. The effectiveness of the proposed method is shown through experiments with a real robot., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE Technical Report, 33, 11, 33-36, Japanese, 1342-6893, 110007227875 - Various Studies on Processing of Facial Image Information
KANEKO Masahide
A "face" is very familiar with us and that is the object which we see most frequently in our daily lives. Everyone has some interests in faces. In the academic fields, the face is treated in various fields such as anthropology, psychology, engineering, and so on. This paper first describes various information which a face conveys and summarizes various research fields relating to a face. Then the progress of studies on processing of facial image information is overviewed. The typical research results on computerized facial caricatures are also introduced., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE technical report, 33, 11, 131-138, Japanese, 1342-6893, 110007227890, AN1059086X - Generation of Caricatures by Automatic Selection of Templates for Shapes and Placement of Facial Parts
TSUCHIHASHI Masakazu; IMAI Jun-ichi; KANEKO Masahide
This paper proposes the template-based method to generate expressive caricatures automatically. This method consists of two steps, that is, the first step to extract and analyze facial parts in an input facial image, and the second step to select an appropriate template for each facial part. Facial parts such as eyes, eyebrows, nose and mouth are extracted from an input face image by using a shape-based pattern matching method. Feature parameters are calculated using principal component analysis on luminance distribution of facial parts extracted from the facial image database of 300 people. Next a hierarchical clustering method is applied to classify facial parts into multiple classes with similar shapes. Multi-class classifier is designed by SVM based on feature parameters and classified results. A class of each facial part in an input face is determined by the multi-class classifier and a caricature can be generated by assigning an appropriate template to each of facial parts. Each template represents the typical or exaggerated shape of selected class. The proposed method reduces the operator's load to interactively select and operate templates. Subjective evaluation of automatically generated caricatures shows the usefulness of the proposed method., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE Technical Report, 33, 11, 77-80, Japanese, 1342-6893, 10025302704 - Generation of Caricatures by Automatic Selection of Templates for Shapes and Placement of Facial Parts
TSUCHIHASHI Masakazu; IMAI Jun-ichi; KANEKO Masahide
This paper proposes the template-based method to generate expressive caricatures automatically. This method consists of two steps, that is, the first step to extract and analyze facial parts in an input facial image, and the second step to select an appropriate template for each facial part. Facial parts such as eyes, eyebrows, nose and mouth are extracted from an input face image by using a shape-based pattern matching method. Feature parameters are calculated using principal component analysis on luminance distribution of facial parts extracted from the facial image database of 300 people. Next a hierarchical clustering method is applied to classify facial parts into multiple classes with similar shapes. Multi-class classifier is designed by SVM based on feature parameters and classified results. A class of each facial part in an input face is determined by the multi-class classifier and a caricature can be generated by assigning an appropriate template to each of facial parts. Each template represents the typical or exaggerated shape of selected class. The proposed method reduces the operator's load to interactively select and operate templates. Subjective evaluation of automatically generated caricatures shows the usefulness of the proposed method., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE Technical Report, 33, 11, 77-80, Japanese, 1342-6893, 110007227854 - Recognition of Dynamically Changing Environment by Autonomous Mobile Robot
ITO Akihisa; IMAI Jun-ichi; KANEKO Masahide
Mobile robots are required to recognize dynamically changing environments to avoid collisions with walkers. Distance information obtained by stereo vision is useful for recognition of surrounding environments. However, there are some problems such that a stereo camera cannot obtain distance information for textureless regions and that objects and their surrounding cannot be distinguished by distance information if they are very close to each other. This paper proposes a method for generating environment models more robustly by integrating distance and color information, and for finding robot's path autonomously using the environment models. The effectiveness of the proposed method is shown through experiments with a real robot., The Institute of Image Information and Television Engineers, 28 Feb. 2009, ITE Technical Report, 33, 11, 21-24, Japanese, 1342-6893, 110007227881 - [フェローからのメッセージ] 顔画像情報処理の研究を振り返って
Feb. 2009, 電子情報通信学会情報・システムソサイエティ誌, 13, 4, 22-23, Japanese, Others - 顔画像情報処理の研究の拡がり(フェロー受賞記念講演,移動カメラ画像処理におけるパターン認識とメディア理解)
「顔」は我々にとって大変身近な存在であり、普段の生活の中で最も良く目にする対象であると言える。顔に対しては、程度の差はあれ誰もが関心を持っている。学問分野においても、人類学、心理学、工学を始めとして、多岐に渡る分野に係わっている。本稿では、顔画像情報処理の研究に関連して、「顔」を研究対象とする意味を述べた後、筆者のこれまでの顔関連研究との係わり合いについて振り返る。次に、現在力を入れて研究に取り組んでいる似顔絵関連の研究成果を簡単に紹介する。最後に、研究マップの形で、顔画像情報処理関連の研究の拡がりについて概観する。, 社団法人電子情報通信学会, 11 Dec. 2008, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 108, 363, 225-230, 0913-5685, 110007123755 - 6.コンピュータ似顔絵(<小特集>いま"顔"が面白い〜顔の画像処理とその応用〜)
社団法人映像情報メディア学会, 01 Dec. 2008, 映像情報メディア学会誌 : 映像情報メディア, 62, 12, 1938-1943, 1342-6907, 110006991086 - コンピュータ似顔絵
Dec. 2008, 映像情報メディア学会誌, 62, 12, 1938-1943, Japanese, Peer-reviwed, Introduction other - 顔画像処理技術と応用に関する研究マップ
金子正秀; 苗村健; 高橋裕樹; 大井隆太朗; 角野眞也
Dec. 2008, 映像情報メディア学会誌, 62, 12, 1944-1945, Japanese, Peer-reviwed, Introduction other - 顔に対する工学的取扱い
Oct. 2008, 日本顔学会誌, 8, 1, 3-20, Japanese, Peer-reviwed, Introduction other, 80019869259 - オクルージョンに頑健な視覚追跡技術 ― 見えないものを推測できるロボットビジョンの実現を目指して ―
今井順一; 金子正秀
Sep. 2008, 映像情報インダストリアル増刊号(まるまる! ロボットビジョン), 40, 11, 66-70, Japanese, Introduction other - D-12-34 Human's View Estimation with Head Model using SIFT Features
Imai Jun-ichi; Kaneko Masahide
The Institute of Electronics, Information and Communication Engineers, 05 Mar. 2008, Proceedings of the IEICE General Conference, 2008, 2, 165-165, Japanese, 110006868938, AN10471452 - 察するインタフェース ~人間とコンピュータ/知能ロボットとの間の新たなインタフェースの実現に向けて~
Jan. 2008, SCAT LINE(財団法人 テレコム先端技術研究支援センター), 季刊, 第73, 2-5, Japanese, Introduction other - Relating Facial Impression Words with Shapes of Facial Parts Using Hierarchical Clustering Method
SATOH Yuusuke; IMAI Jun-ichi; KANEKO Masahide
There are various facial impression words such as "face likegourd," "lip like cod roe," and so on, describing facial features concisely appropriately. Some of them are vague and some are concrete. This paper proposed a hierarchical classification of shapes of facial parts as the method to classify various facial impression words systematically. Firstly, coordinates of feature points in each facial part are analyzed by the principal component analtsis. Obtained principal component scores are used as parameters to carry out the hierarchical classification. Classified results will coincide with the classification of shapes of facial part. We have collected facial impression words corresponding to a typical shape generated in each hierarchy. Then facial impression words are assigned to each typical shape. This means the quantitative correspondence between set of principal components representing typical shape and facial impression words. Experiments for the shapes of eyes and mouth show the usefulness of the proposed method., The Institute of Electronics, Information and Communication Engineers, 12 Mar. 2007, IEICE technical report, 106, 608, 35-40, Japanese, 0913-5685, 110006248397, AN10013006 - Development of Robot with Autonomous Switching Method Between Parallel and Cascade Positions with Walking User
HANAI Kumie; IMAI Jun-ichi; KANEKO Masahide
When two humans move together through a corridor, they usually will take a "parallel position," that is, they will walk side by side. However, if there is an obstacle in their way and it narrows the corridor, they will naturally switch their position from the "parallel" to "cascade position" in which one is behind the other. In this paper, we propose a method for enabling a robot to switch these parallel and cascade positions autonomously according to forward obstacles when it moves with a user in a corridor. The robot estimates when the user starts avoiding the obstacle based on observed images. Then the robot autonomously decides whether the robot goes on ahead or the robot gives way to the user. Experimental results using a real robot show the effectiveness of the proposed method., The Institute of Electronics, Information and Communication Engineers, 12 Mar. 2007, IEICE technical report, 106, 608, 59-64, Japanese, 0913-5685, 110006248401, AN10013006 - Automatic Generation of Best-shot Image using Blink Detection Method Robust for Variations in Spatial Resolution
OZAKI Yuya; IMAI Jun-ichi; KANEKO Masahide
We often exoerience that some persons have closed their eyes in the photograph. This paper proposes the method to automatically output the best shot image in which all members open their eyes. Firstly a series of photographs (here 6 frames) are taken by using the function of continuous release provided in a commercial digital camera. Blinking of each person is checked in each frame, and the frame in which all members open their eyes is selected. Blinking detection is carried out by calculating the normalized correlation between 30x6 pixels open eyes template and input frames of reduced size. Next, for the case that no frame exists in which all members open their eyes, closed eye image is replaced by open eye image obtained in the different frame. Experimental results using 14 kinds of photographs taken under various conditions show the usefulness of the proposed method to output the best shot image automatically., The Institute of Electronics, Information and Communication Engineers, 12 Mar. 2007, IEICE technical report, 106, 608, 41-46, Japanese, 0913-5685, 110006248398, AN10013006 - Development of a E-mail System for Mobile Phone Using Integration of Facial Caricature and Face Mark
MATSUO Kenji; SATOU Yusuke; HASHIMOTO Masayuki; KOIKE Atsushi; IMAI Jun-ichi; KANEKO Masahide
This paper proposes a new E-mail system using facial caricature. This E-mail system displays facial caricature of sender person as well as sentences of received E-mail. The facial caricature changes its expressions according to face marks. Eigenspaces on shape and arrangement of facial parts, such as eyes, nose, mouse, and so forth, are calculated from feature points of sample face images by principal component analysis. A new input facial image is projected onto the eigen spaces and facial caricature changes its expressions adjusting the expansion coefficients on the eigenspace. In order to change facial expression according to face mark in E-mail, 140 general face marks are respectively fitted to basic facial expressions, such as surprise, angry, cry, and so forth. The proposed E-mail system encourages that facial caricatures transmit emotions which are difficult to be extracted from sentences and they also offer means of smooth communication., Information Processing Society of Japan (IPSJ), 05 Mar. 2007, IPSJ SIG Notes, 2007, 22, 65-70, Japanese, 0919-6072, 110006277777, AN10438399 - Visual Tracking in Occlusion Environments using Particle Filter with Autonomous Switching Mechanism of Targets
IMAI Jun-ichi; KANEKO Masahide
Visual tracking is required by many vision applications. However, in daily living spaces where some of such applications are assumed to be used, stable tracking is often difficult because there are many objects which are possible to cause the visual occlusion. In this paper, to handle this occlusion problem, we propose a novel method for visual tracking by a particle filter, which switches tracking targets autonomously. In our method, if an occlusion occurs during the tracking, the model of the occluder is dynamically created and the tracking target is switched to this model. Thus, our method enables the tracker to indirectly track the "invisible target" by switching its target to the occluder properly. Experimental results show the effectiveness of our method., The Institute of Electronics, Information and Communication Engineers, 18 Jan. 2007, IEICE technical report, 106, 500, 31-36, Japanese, 0913-5685, 110006204903, AN10091178 - Omni-directional Estimation of Sound Source Location and Its Application to Estimation of Speaker's Position by Combining with Skin-color Information
TAKAHASHI Satoshi; IMAI Jun-ichi; KANEKO Masahide
A user doesn't always stand in front of a robot and may sometimes call a robot from its back. Therefore a robot should know the user's position first to start communication with him/her. This paper proposes the omni-directional estimation method of speaker's position using the combination of audio and color information. Estimation of the position of sound source is carried out to calculate the difference of arrival time from the sound source to multi-channel microphones. Number of microphones and their optimal arrangement are derived considering the accuracy and processing time for 3-D estimation of sound source position. Next the robust detection of skin-color region is carried out by combining a trained GMM (Gaussian Mixture Model) for input scene with a general GMM. Bayesian network is employed to combine the result of sound source estimation and detection of skin-color region, and to realize a highly accurate estimation of speaker's location. Experimental results are shown to demonstrate the usefulness of the proposed methods., The Institute of Electronics, Information and Communication Engineers, 15 Mar. 2006, IEICE technical report, 105, 683, 7-12, Japanese, 0913-5685, 110004735551, AN10476092 - マルチモーダル情報に基づくユーザ毎の優先度を考慮したロボットとユーザとのコミュニケーション(コミュニケーション,ヒューマンコミュニケーショングループ(HCG)シンポジウム)
崔元杰; 今井順一; 金子正秀
ロボットと複数のユーザとのコミュニケーションにおいては、ユーザとの距離或いはユーザの顔の向きといった単一の情報に基づくのではなく、マルチモーダルな形でユーザに関する多くの情報を得、状況に応じた反応を行わせる必要がある。本論文では、ユーザの顔の向き、ジェスチャ、音声、距離などのマルチモーダル情報の統合により、ロボットに対するユーザの関心の高さの度合を評価する基準になる「優先度」を定義する。ユーザごとの「優先度」を一定時間間隔で計算することにより、複数のユーザの中からより優先度が高いユーザを選択してコミュニケーションを行う。ロボットの実機を用いて3人のユーザとのコミュニケーションに関する実験を行い、状況に応じた優先度が計算され、コミュニケーションの相手の選択が適切に行われることを確認した。, 社団法人電子情報通信学会, 15 Mar. 2006, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 105, 683, 37-42, 0913-5685, 110004735556 - Automatic Synthesis of Facial Caricatures Animation Using Separation of Expressions and Face Features by Linear Discriminant Analysis
SHA Xiu; IMAI Jun-ichi; KANEKO Masahide
A facial caricature represents features of individual face compactly and effectively. An individual face can be expressed richer by adding "Kansei" information. This paper proposes a method which can automatically synthesize facial caricatures animation using expression vector separated from facial features space. Fisher's linear discriminant analysis is utilized to obtain expression vector which represents transformation from one kind of facial expression to another one. While the principal component analysis is employed to find the normalized orthogonal bases of the linear subspace of facial features. Then, Gram-Schmidt decomposition is incorporated to construct new normalized orthogonal bases in which the expression vector is separated from other vectors representing facial features. Finally, we can transform the facial expression of the input face to a new one by changing the orthogonal decomposition coefficients of the original facial expression. The usefulness of the proposed method is shown by human's subjective evaluations., The Institute of Electronics, Information and Communication Engineers, 15 Mar. 2006, IEICE technical report, 105, 681, 61-66, Japanese, 0913-5685, 110004690858, AN10487226 - Intelligent Handling of Relative Positions among Robot, User, and Objects and Its Application to Human-Robot Interaction
TSUIKI Shoichi; IMAI Jun-ichi; KANEKO Masahide
When people communicate each other, it's important to recognize the relative positions in 3D space. For the case that a robot and a user communicate each other, it's also important to recognize their relative positions with objects. This paper proposes the interaction method based on the recognition of relative position and direction of user to a robot and an object. A robot guides the user to the position of the object which the user wants to get. The robot recognizes the user's position and direction by extracting user's face and hair from input image sequence, and the position of the object by extracting its color. By combining these results, the robot can recognize their relative positions, and says "go to the right 1m", "go straight 2m" and so on to guide the user. Experimental results using a communication robot are shown to demonstrate the actual interaction based on the proposed methods., The Institute of Electronics, Information and Communication Engineers, 15 Mar. 2006, IEICE technical report, 105, 683, 43-48, Japanese, 0913-5685, 110004735557, AN10476092 - Interpretation of Human Actions for Each Body Part Based on Object Information and Similitude
LOKMAN Juanda; IMAI Junichi; KANEKO Masahide
This paper describes the interpretation method of human actions in daily lives, which are rich of varieties in motion and very ambiguous. We present an approach for extracting human object from the scene using distance cue, face detection and skin color. We use only one stereo camera without any information about its location, except the optical axis is parallel to the ground. Human actions can be very ambiguous and moreover some actions involve only one body part while the others could involve more than one body part. Thus object as a context and the relationship among objects that share some level of similitude (e.g., dimensionality, texture/outline, material) can be used as a cue for interpreting ambiguous human actions in daily lives. We will show some examples of the advantage of object context and relationship among objects for the recognition of human actions., The Institute of Electronics, Information and Communication Engineers, 15 Mar. 2006, IEICE technical report, 105, 681, 55-60, English, 0913-5685, 110004690857, AN10487226 - ユーザとロボットとの間での注意の共有 ~ロボットは人間と同じ対象に注意を向けられるか~(特別寄稿)
日立国際電気, Mar. 2006, 日立国際電気技報2005年度版, 6, 1-9, Japanese, Introduction other, 1346-5953, 40007354654, AA11814100 - Localization and Tracking of 3-D Sound Source based on Integration of Audiovisual Information
KITAZAWA Kokichi; CHEN Bin; KANEKO Masahide
Automatic changing of line of sight based on audiovisual information under the real environment is the important function of future intelligent robot to make the interaction between robot and human smoother. Integrated processing of both visual and audio information enables a robot to grasp the changes in surrounded scenes more properly compared with the case where visual and audio information is processed separately. This paper first discusses the 3-D sound source localization method based on the integration of visual and audio information. A particle filter is introduced to improve the accuracy in sound source localization even for the case where sound source or robot is moving around. Furthermore a robot acts according to the movement of sound source. Several experimental results show the usefulness of the proposed methods., The Institute of Electronics, Information and Communication Engineers, 18 Mar. 2005, Technical report of IEICE. HCS, 104, 745, 19-24, Japanese, 0913-5685, 110003271829, AN10487226 - 人間型ロボットとユーザとの間での顔アクションに基づく共感と反応
高田元一郎; 金子正秀
17 Mar. 2005, 電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎, 104, 744, 1-6, 10015550830 - オブジェクトとの関係における拘束を考慮した人物動作の理解
ロクマンジュアンダ; 金子正秀
17 Mar. 2005, 電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎, 104, 744, 35-40, 10015550887 - Quantitative Analysis for Impression Expression of Facial Features And Its Application to Discrimination of Facial Attributes
NISHINO Fumiyasu; KANEKO Masahide
Facial caricatures represent features of individual faces compactly and effectively, and they are frequently used in the various situations such as newspapers, magazines, web, and so on. Description of facial features using eigenspaces enables not only automatic drawing facial caricatures, but also various quantitative discussions for facial impressions. This paper proposes a system which can output how much each of features of the sex, age and six basic facial expressions (happiness, surprise, fear, anger, disgust, sadness) is contained in an inputted face. Firstly the principal component analysis for facial features using the face database is described. An average face of each of above categories is calculated, and the orthogonal expansion to obtained eigenspaces are carried out for each average face. By this it becomes clear that the distribution of important principal components is different for an average face corresponding to each category. Then, the orthogonal expansion of inputted face into calculated eigenspaces is carried out. How close expansion coefficients of inputted face to those of each of average faces of different categories is distinguished, and the similarity between each principal component is evaluated. This makes it possible to estimate that how much an inputted face contains each of facial impressions such as sex, age, and six basic facial expressions. Obtained similarity values are close to results of human's subjective evaluation. Therefore the proposed method is useful to quantitative analysis of facial impressions. This system can treat various facial impression words by preparing a typical face corresponding to each of facial impression words. In the future, it will be possible to retrieve faces having specific facial impressions from facial database by using the proposed method., The Institute of Electronics, Information and Communication Engineers, 17 Mar. 2005, Technical report of IEICE. HCS, 104, 744, 13-18, Japanese, 0913-5685, 110003271817, AN10487226 - Sympathy and Reaction based of Facial Actions Between Humanoid and User
TAKADA Motoichirou; KANEKO Masahide
Giving an intelligent robot "heart" and "feeling" may improve its adaptation to human society. This topic has been studied actively till now. However in conventional studies, a robot communicates to human unidirectonally, and the user's evaluation on robot's actions often depends on personal view of each user. This paper constructs the system in which a robot shares the sympathy with human's facial actions and gives an appropriate reaction. This aims to make human feel that a robot shares the sympathy with him. As facial actions, this paper treats several types such as "kiss", "put out one's tongue to someone", "peek a boo" and "yawn." A robot gives an appropriate reaction corresponding to each of facial actions. In subjective evaluation experiments using the constructed system, human has feeling that a robot shares sympathy with him., The Institute of Electronics, Information and Communication Engineers, 17 Mar. 2005, Technical report of IEICE. HCS, 104, 744, 1-6, Japanese, 0913-5685, 110003271815, AN10487226 - オブジェクトとの関係における拘束を考慮した人物動作の理解(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
ロクマンジュアンダ; 金子正秀
日常生活の中で、我々は環境内の一つ或いは複数のオブジェクトに関わるような行動を良くする。例えば、キーボードをタイプする、電話をしながら歩く、コップで水を飲む、本を読む等である。日常生活における人間の動作の多くは環境内のオブジェクトと密接に関係している。本論文では、オブジェクトとの関係における拘束を考慮して、観測された身体部分の動作を解析することにより、人間の動作を理解する方法について述べる。環境内のオブジェクトと人物の動作との関係の取扱いを容易にするために、環境の3次元モデル及び人物の上半身のスティックモデルからなる仮想世界を構成する。実環境における人物動作をこの仮想世界に反映させることにより、オブジェクトとの関係に基づく人物動作の理解を行う。机の前に座ったユーザが机上のオブジェクトを手で動かすようなシーンに対する実験例により、本方法による人物動作の理解の結果を具体的に示す。, 社団法人電子情報通信学会, 17 Mar. 2005, 電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎, 104, 744, 35-40, 0913-5685, 110003271821 - D-12-89 まばたき検出に基づくベストショットの選択及び加工(D-12. パターン認識・メディア理解, 情報・システム2)
入江淳; 金子正秀
社団法人電子情報通信学会, 07 Mar. 2005, 電子情報通信学会総合大会講演論文集, 2005, 2, 110004746419 - D-12-40 Motion Detection using Omni-Directional Camera Mounted on Moving Platform
Thatsaphan Suwannathat; Kaneko Masahide
The Institute of Electronics, Information and Communication Engineers, 07 Mar. 2005, Proceedings of the IEICE General Conference, 2005, 2, 190-190, English, 110004746370, AN10471452 - Object Search in a Real Environmental based on Instruction by a User Containing Ambiguity
This paper discusses the system in which a robot searches an object in a real environment through the interaction with a user. The interaction is carried out as a dialogue manner. According to user's instructions, a robot behaves so that the user's load for instruction is reduced as much as possible. As for the detected object, a robot records its features and the history of search, and they are used for object search in the future. In order to realize a natural and smooth interaction which resembles one between humans, the extraction of search area from an observed image, region segmentation based on spatial arrangement of objects, spontaneous action by a robot and so on are incorporated in the proposed system. Experimental results in searching a book on shelves through different types of instruction words show the effectiveness of the proposed system., The Institute of Electronics, Information and Communication Engineers, 18 Mar. 2004, Technical report of IEICE. HCS, 103, 742, 41-46, Japanese, 0913-5685, 110003271439, AN10487226 - D-12-72 A Face Image Recognition Scheme Using Virtual Subspace Added Light Influences
Matsuo Kenji; Hashimoto Masayuki; Koike Atsushi; Kaneko Masahide
The Institute of Electronics, Information and Communication Engineers, 08 Mar. 2004, Proceedings of the IEICE General Conference, 2004, 2, 238-238, Japanese, 110003263897, AN10471452 - Restoration of Images Degraded by Blur and Additive Noise using Weighted Median Filters with Frequency Selective Property
MEGURO Mitsuhiko; KANEKO Masahide; KUREMATSU Akira
The Institute of Electronics, Information and Communication Engineers, 10 Sep. 2003, Proceedings of the Society Conference of IEICE, 2003, 73-73, Japanese, 110003321448, AN10489017 - 固有空間法による顔特徴の解析と似顔絵の生成(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
水野友和; 目黒光彦; 金子正秀
コンピュータによる似顔絵生成は、新聞・雑誌での利用にとどまらず、ホームページヘの掲載、顔画像のデータベース検索、携帯電話などにおけるエージェントとしての利用など様々な応用が期待されている。本論文では固有空間法を用いた似顔絵生成手法を基に、顔印象に係わる言語表現に対する対話的な操作によって似顔絵を生成する方法について述べる。まず、実顔データにおける顔部品の形状や配置に関する情報の分析によって得られた主成分に対し、対話的な操作を施して似顔絵の特徴を変化させるシステムを関発した。このシステムを利用して主成分が担う形状的特徴を明確にし、形状情報と配置情報の分離を行った。次に言語表現と、主成分の組合せに基づいた似顔絵合成とを、ファジィ推論によって関係付け、言語表現に対応した似顔絵を生成するシステムを構築した。最後に、主成分操作とファジィ推論による似顔絵生成について主観評価実験を行った。実験により寄与率と感覚的な重要度の関係やファジィ推論による似顔絵生成の有効性が明らかになった。, 社団法人電子情報通信学会, 11 Mar. 2003, 電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎, 102, 734, 37-42, 0913-5685, 110003271373 - Detection of Newly Placed Objects from Indoor Image Sequence
Fujii Asako; Meguro Mitsuhiko; Kaneko Masahide
The Institute of Electronics, Information and Communication Engineers, 03 Mar. 2003, Proceedings of the IEICE General Conference, 2003, 2, 269-269, Japanese, 110003239831, AN10471452 - 2001 ITE Winter Annual Convention
KANEKO Masahide
The Institute of Image Information and Television Engineers, 01 Apr. 2002, The Journal of the Institute of Image Information and Television Engineers, 56, 4, 567-569, Japanese, 1342-6907, 110003670905, AN10588970 - D-11-84 領域追跡により生成されたチューブに基づく動画像の時空間領域分割
目黒光彦; 金子正秀; 榑松明
電子情報通信学会, 07 Mar. 2002, 電子情報通信学会総合大会講演論文集, 2002, 2, 20003362637 - Motion Control of Mobile Robot with Human's Walking Pattern Obtained by Moving Images
Guan Jian; Meguro Mitsuhiko; Kaneko Masahide
The Institute of Electronics, Information and Communication Engineers, 07 Mar. 2002, Proceedings of the IEICE General Conference, 2002, 358-358, Japanese, 110003496549, AN10471452 - Representation of 3-D Movement in Automatically Synthesized Virtual Space Using Limited Number of Real Perspective Images
SUGIYAMA Shin; MEGURO Mitsuhiko; KANEKO Masahide
In this paper, we propose a method to synthesize virtual space automatically by using limited number of real perspective images. First, each input image is divided into five regions, that is, sky, ground, right and left sides, and back, based on the position of vanishing point. Then these five regions are used to estimate the rectangular parallelepiped model of 3-D scene. Several images, which are taken at adjacent view positions, are used to estimate similar rectangular parallelepiped models. These models are allocated in consideration of mutual positions. Finally, 3-D movement of view position and view direction is represented by synthesizing arbitrary view images using above models and texture of input images., The Institute of Electronics, Information and Communication Engineers, 01 Mar. 2002, Technical report of IEICE. Multimedia and virtual environment, 101, 701, 19-24, Japanese, 0913-5685, 110003271045, AN10476092 - Synthesis of Animated Facial Caricatures with Mouth Shape Changes Corresponding to Speech
YAMADA Sayaka; MEGURO Mitsuhiko; KANEKO Masahide
Facial caricatures emphasize the individual facial features and describe them compactly. For facial caricatures, it is possible to employ more flexible representation of shape and motion than for real facial images. This paper proposes a method to synthesize animated facial caricatures with smooth changes in mouth shapes corresponding to speech, even if mouth shape features are emphasized. Width and opening of mouth, thickness of lips are adjusted by Fuzzy theory according to the degree of feature emphasis for mouth shape. Input speech is segmented into phonemes. Mouth shapes for consecutive phonemes are interpolated to generate smooth mouth shape changes in animated facial caricature. Experimental results show the effectiveness of the proposed method., The Institute of Electronics, Information and Communication Engineers, 28 Feb. 2002, Technical report of IEICE. HCS, 101, 693, 33-40, Japanese, 0913-5685, 110003271779, AN10487226 - 12-4 チューブ生成に基づく動画像の時空間領域分割とオブジェクト抽出への応用
目黒光彦; 金子正秀; 槫松明
社団法人映像情報メディア学会, 06 Dec. 2001, 映像情報メディア学会冬季大会講演予稿集, 2001, 1343-4357, 110003672594 - 12-7 少数の透視投影画像こ基づく視点位置と視線方向の3次元移動表現
杉山慎; 目黒光彦; 金子正秀
社団法人映像情報メディア学会, 06 Dec. 2001, 映像情報メディア学会冬季大会講演予稿集, 2001, 1343-4357, 110003672597 - 12-8 特徴強調を考慮した似顔絵アニメーションにおける口形状表現
山田清香; 目黒光彦; 金子正秀
社団法人映像情報メディア学会, 06 Dec. 2001, 映像情報メディア学会冬季大会講演予稿集, 2001, 1343-4357, 110003672598 - 2001 ITE Annual Convention
KANEKO Masahide
The Institute of Image Information and Television Engineers, 01 Dec. 2001, The Journal of the Institute of Image Information and Television Engineers, 55, 12, 1629-1633, Japanese, 1342-6907, 110003692925, AN10588970 - Speech Enhancement and Recognition in Cars Using Microphone Array and Speech Separation
Nagai Takayuki; Kaneko Masahide; Kurematsu Akira
The Institute of Electronics, Information and Communication Engineers, 29 Aug. 2001, Proceedings of the Society Conference of IEICE, 2001, 108-108, Japanese, 110003348486, AN10489017 - A-15-10 対象の時空間配置を表す言葉を用いたコンピュータとの知的インタラクション
竹内伸吾; 目黒光彦; 金子正秀
社団法人電子情報通信学会, 29 Aug. 2001, 電子情報通信学会ソサイエティ大会講演論文集, 2001, 110003348579 - Automatic Synthesis of Pseudo 3-D Scenes Using Limited Number of Perspective Images
SUGIYAMA Shin; MEGURO Mitsuhiko; KANEKO Masahide
The Institute of Electronics, Information and Communication Engineers, 29 Aug. 2001, Proceedings of the Society Conference of IEICE, 2001, 209-209, Japanese, 110003348587, AN10489017 - マイクロホンアレーを用いた話者位置推定による車載音声認識
近藤啓介; 長井隆行; 金子正秀; 榑松明
自動車内では、走行音やラジオ音など様々な雑音が存在する。これらの雑音が重畳した音声信号を音声認識システムにそのまま入力すると、認識率が大幅に低下する。また、室内環境に比べSN比がかなり低いため、雑音除去や音声強調を行うことは容易でない。従って、自動車内での音声認識の本格的な実用化のためには、雑音に対する性能のさらなる向上が不可欠である。本稿では、マイクロホンアレーを用いた話者位置推定による車載音声認識の方法を提案する。提案方法では、まず、マイクロホンアレーを2次元的に配置する。マイクロホンアレーからの入力信号に対して、HE(Harmonic Enhanced) 2-D MUSIC(MUltiple SIgnal Classification)法を適用する。HE 2-D MUSIC法は、話者位置推定法であるMUSIC法を2次元に拡張するとともに、調波構造を利用して人間の音声と雑音を識別する手法である。また、2次元に拡張した遅延和アレー(Delay-and-Sum:DS)を用いて音声強調を行う。これらの手法によって、話者位置以外の雑音の抑制と話者位置の音声成分の強調が実現される。強調された音声信号を音声認識部の入力とすることにより、自動車内での雑音がある状況下において、どの座席の話者に対しても高性能な音声認識が可能となる。計算機シミュレーションにおける実験結果および実車走行時での..., 社団法人電子情報通信学会, 22 Mar. 2001, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 100, 717, 7-12, 0913-5685, 110003198646 - 情景画像中の文字及び看板領域の抽出
長井隆行; 影広達彦; 金子正秀; 榑松明
本報告では,複雑な背景を持つ情景画像から自動的に文字を抽出する手法について述べる.提案方法は,フィードフォワードニューラルネットワークをベースとしている.ニューラルネットワークは,画像中の小領域(ブロック)内の特徴量から,その領域が文字であるか非文字であるかを判別する.その際,文字の特徴量として,ウェーヴレット変換係数,独立成分分析の結果,特徴空間からの距離を組み合わせて用いることで,高精度の識別を行う.また,色による画像の領域分割をベースとした看板領域抽出手法も提案する.文字抽出法と看板抽出法を統合することにより,情景画像中に存在する文字を効率よく抽出することが可能となる.最後に,実際の情景画像を用いた実験結果により,提案方法の有効性を明らかにする., 社団法人電子情報通信学会, 22 Mar. 2001, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 100, 717, 103-108, 0913-5685, 110003198659 - マイクロホンアレーを用いた話者位置推定による車載音声認識
近藤啓介; 長井隆行; 金子正秀; 搏松明
自動車内では、走行音やラジオ音など様々な雑音が存在する。これらの雑音が重畳した音声信号を音声認識システムにそのまま入力すると、認識率が大幅に低下する。また、室内環境に比べSN比がかなり低いため、雑音除去や音声強調を行うことは容易でない。従って、自動車内での音声認識の本格的な実用化のためには、雑音に対する性能のさらなる向上が不可欠である。本稿では、マイクロホンアレーを用いた話者位置推定による車載音声認識の方法を提案する。提案方法では、まず、マイクロホンアレーを2次元的に配置する。マイクロホンアレーからの入力信号に対して、HE(Harmonic Enhanced) 2-D MUSIC(MUltiple SIgnal Classification)法を適用する。HE 2-D MUSIC法は、話者位置推定法であるNIUSIC法を2次元に拡張するとともに、調波構造を利用して人間の音声と雑音を識別する手法である。また、2次元に拡張した遅延和アレー(Delay-and-Sum:DS)を用いて音声強調を行う。これらの手法によって、話者位置以外の雑音の抑制と話者位置の音声成分の強調が実現される。強調された音声信号を音声認識部の入力とすることにより、自動車内での雑音がある状況下において、どの座席の話者に対しても高性能な音声認識が可能となる。計算機シミュレーションにおける実験結果および実車走行時で..., 社団法人電子情報通信学会, 22 Mar. 2001, 電子情報通信学会技術研究報告. CS, 通信方式, 100, 721, 7-12, 0913-5685, 110003283141 - 情景画像中の文字及び看板領域の抽出
長井隆行; 影広達彦; 金子正秀; 搏松明
本報告では,複雑な背景を持つ情景画像から自動的に文字を抽出する手法について述べる.提案方法は.フィードフォワードニューラルネットワークをベースとしている.ニューラルネットワークは,画像中の小領域(ブロック)内の特徴量から.その領域が文字であるか非文字であるかを判別する.その際,文字の特徴量として.ウェーヴレット変換係数.独立成分分析の結果,特徴空間からの距離を組み合わせて用いることで.高精度の識別を行う.また.色による画像の領域分割をベースとした看板領域抽出手法も提案する.文字抽出法と看板抽出法を統合することにより.情景画像中に存在する文字を効率よく抽出することが可能となる.最後に.実際の情景画像を用いた実験結果により.提案方法の有効性を明らかにする., 社団法人電子情報通信学会, 22 Mar. 2001, 電子情報通信学会技術研究報告. CS, 通信方式, 100, 721, 103-108, 0913-5685, 110003283154 - Speech Recognition and Enhancement in Cars by Estimation of Speaker's Position Using Microphone Array
KONDO Keisuke; NAGAI Takayuki; KANEKO Masahide; KUREMATSU Akira
This paper proposes a speech recognition and enhancement system for noisy car environments based on the microphone array technology. In our proposed system, multiple microphones are arranged in 2-dimensional space and the speaker's location is estimated first by HE(Harmonic Enhanced) 2-D MUSIC(MUltiple SIgnal Classification) method. Then, simple Delay-and-Sum(DS) is applied to remove noises. Such pre-processing process makes the robust speech recognition in noisy car environments possible. An advantage of the proposed system is that not only a driver, but also other passengers can easily use speech recognition by their voices no matter where they are sitting. The results of computer simulation for the estimation of speaker's position and speech recognition are shown to confirm the validity of our proposed system. We also present the results of experiment in a real car environment., The Institute of Electronics, Information and Communication Engineers, 22 Mar. 2001, Technical report of IEICE. DSP, 100, 719, 7-12, Japanese, 0913-5685, 110003280403, AN10060786 - Text and Signboard Detection in Scene Images
NAGAI Takayuki; KAGEHIRO Tatsuhiko; KANEKO Masahide; KUREMATSU Akira
In this paper a method of text detection in a complex scene image is presented. The proposed detector is based on a feed forward neural network. The neural network, which is trained by a large number of positive and negative samples, classifies small regions (blocks) of an input image as text or non-text. By using coefficients of wavelet transform, results of Independent Component Analysis(ICA), and Distance From Feature Space(DFFS) as the features of characters, the performance of the detector is improved considerably. We also propose a signboard detection method based on color segmentation. Moreover, the integration of these two detectors is discussed. Experimental results show the effectiveness of the proposed method., The Institute of Electronics, Information and Communication Engineers, 22 Mar. 2001, Technical report of IEICE. DSP, 100, 719, 103-108, Japanese, 0913-5685, 110003280416, AN10060786 - 顔による個人認証の最前線
The Institute of Image Information and Television Engineers, Feb. 2001, 映像情報メディア学会誌, 「個人認証技術の最前線」小特集 2-3, 55, 2, 180-184, Japanese, Introduction other, 1342-6907, 110003685738, AN10588970 - Extraction of Characters on Signboards form Various Scene Images
FU Hang; NAGAI Takayuki; KANEKO Masahide; KUREMATSU Akira
Recognizing characters on signboards in a scene would be very useful for a translation, an acquisition of relevant information through Internet, and so on. In this paper we present a method for extracting characters on signboards in arbitrary scene images, which does not require any manual operation. We first describe briefly the framework of information handling system driven by characters on signboards in scene images. Next, a method for detecting signboard regions and each character region is investigated by considering a characteristic of signboards. The proposed method for extracting signboard regions is based on hierarchical clustering in L^*a^*b^* color space. Each character on signboards is extracted by using a binarization followed by horizontal and vertical projections. The effectiveness of the proposed method is shown through an experiment with 1000 various scene images., The Institute of Image Information and Television Engineers, 31 Jan. 2001, ITE Technical Report, 25, 9, 13-18, Japanese, 1342-6893, 110003689323, AN1059086X - Extraction of Characters on Signboards from Various Scene Images
Recognizing characters on signboards in a scene would be very useful for a translation, an acquisition of relevant information through Internet, and so on. In this paper we present a method for extracting characters on signboards in arbitrary scene images, which does not require any manual operation. We first describe briefly the framework of information handling system driven by characters on signboards in scene images. Next, a method for detecting signboard regions and each character region is investigated by considering a characteristic of signboards. The proposed method for extracting signboard regions is based on hierarchical clustering in L^*a^*b^* color space. Each character on signboards is extracted by using a binarization followed by horizontal and vertical projections. The effectiveness of the proposed method is shown through an experiment with 1000 various scene images., The Institute of Electronics, Information and Communication Engineers, 24 Jan. 2001, IEICE technical report. Electronic information displays, 100, 605, 13-18, Japanese, 0913-5685, 110003269784, AN10060775 - 屋内外の情景画像を対象とした看板文字の自動抽出
傅杭; 長井隆行; 金子正秀; 榑松明
屋内外の看板に書かれている文字情報を認識し、翻訳したり、通信を介して関連情報を取出すことができれば、大変便利である。本論文では、対象画像に対する制約が少なく、また、手動での操作を必要としない看板文字の自動抽出方法について述べる。まず、情景画像中の看板文字をキーとした情報活用システムの枠組みについて述べる。次に、看板を含んだ情景画像の特徴を考慮した、看板領域と文字領域の抽出方法を検討する。入力画像に対してRGB空間からL^*a^*b^*均等色空間への変換を行った後に、階層的なクラスタリングにより看板領域を抽出する。抽出した看板領域内を2値化し、水平、垂直方向への射影を利用することで文字領域を抽出する。屋内外で撮影した1000枚の情景画像を用いて看板領域の抽出及び文字抽出の実験を行い、本手法の有効性を明らかにする。, 社団法人電子情報通信学会, 24 Jan. 2001, 電子情報通信学会技術研究報告. IE, 画像工学, 100, 607, 13-18, 0913-5685, 110003195437 - PCSJ2000/IMPS2000
KANEKO Masahide
The Institute of Image Information and Television Engineers, 20 Jan. 2001, The journal of the Institute of Image Information and Television Engineers, 55, 1, 89-89, Japanese, 1342-6907, 110003692893, AN10588970 - 1-5 情景画像中の看板領域の抽出
傳杭; 長井隆行; 金子正秀; 榑松明
社団法人映像情報メディア学会, 06 Dec. 2000, 映像情報メディア学会冬季大会講演予稿集, 2000, 1343-4357, 110003672428 - 1-6 MPEG符号化データを利用したサッカー映像の自動分類
玄蕃一輝; 金子正秀; 榑松明
社団法人映像情報メディア学会, 06 Dec. 2000, 映像情報メディア学会冬季大会講演予稿集, 2000, 1343-4357, 110003672429 - Automatic Recognition of Signboard Characters for Information Acquisition From Scene Image
FU Hang; NAGAI Takayuki; KANEKO Masahide; KUREMATSU Akira
The Institute of Electronics, Information and Communication Engineers, 07 Sep. 2000, Proceedings of the Society Conference of IEICE, 2000, 210-210, Japanese, 110003349483, AN10489017 - Speech Recognition and Enhancement in Cars Using Estimation of Speaker's Position by 2-D MUSIC Method
KONDO Keisuke; NAGAI Takayuki; KANEKO Masahide; KUREMATSU Akira
The Institute of Electronics, Information and Communication Engineers, 07 Sep. 2000, Proceedings of the Society Conference of IEICE, 2000, 315-316, Japanese, 110003349585, AN10489017 - 車載音声認識のための2次元MUSIC法を用いた話者位置推定
近藤啓介; 長井隆行; 金子正秀; 榑松明
社団法人電子情報通信学会, 07 Mar. 2000, 電子情報通信学会総合大会講演論文集, 2000, 110003259770 - 高密度記録を可能とする画像圧縮技術(基礎講座<光ディスク >)
応用物理学会, Feb. 2000, 応用物理, 69, 2, 201-207, Japanese, Introduction other, 0369-8009, 10004645861, AN00026679 - 顔部品の形状特徴と配置特徴の強調による似顔絵の生成 (特集テーマ・顔・表情・ジェスチャの認識・合成) -- (顔の認識・生成)
徐光哲; 金子正秀; 榑松明
電子情報通信学会, 19 Nov. 1999, 電子情報通信学会技術研究報告, 99, 19-24, 0913-5685, 40004658920 - Synthesis of Facial Caricatures Based on Exaggeration of Features in Shapes and Arrangement of Facial Parts
XU GuangZhe; KANEKO Masahide; KUREMATSU Akira
Facial caricatures represent features of individual faces compactly and effectively. In this paper, we consider the facial information as the combination of shape information of each of facial parts and their arrangement information. To describe and exaggerate the features in shape information and those in arrangement information, eigenspaces are employed. Eigenspaces are derived for shape of each facial part and arrangement of facial parts, respectively. Exaggeration process is performed through each eigenspace independently. Therefore, the proposed method can control the shape features and arrangement features independently and possesses the high flexibility in drawing facial caricatures., The Institute of Electronics, Information and Communication Engineers, 19 Nov. 1999, Technical report of IEICE. HIP, 99, 452, 19-24, Japanese, 0913-5685, 110003272693, AN10487237 - 23-8 Synthesis of Facial Caricature Using Eigenspaces for Facial Parts
Xu GuangZhe; Kaneko Masahide; Kurematsu Akira
A facial caricature represents the individual facial features very well. This paper presents a method to synthesize a facial caricature using the eigenspaces calculated independently for each of shapes and arrangement of facial parts. Feature in an input face image are emphasized by controlling coefficient value for each eigen vector. Experimental results show the effectiveness of the proposed method., The Institute of Image Information and Television Engineers, 23 Aug. 1999, PROCEEDINGS OF THE ITE ANNUAL CONVENTION, 1999, 1999, 324-325, Japanese, 1343-1846, 110006415593, AA11395540 - Synthesis of Facial Caricature with Different Styles Based on Switching of Multiple Eigenspaces
Xu Guang Zhe; Kaneko Masahide; Kurematsu Akira
The Institute of Electronics, Information and Communication Engineers, 16 Aug. 1999, Proceedings of the Society Conference of IEICE, 1999, 243-244, Japanese, 110003346080, AN10489017 - 異なるフィルタ長をもつ重複直交変換の実現とサブバンド画像符号化への応用
長井隆行; 池原雅章; 金子正秀; 榑松明
本論文では、異なる長さの基底関数をもつ重複直交変換(LOT)について考える。従来のLOTは、すべての基底関数(フィルタ)がチャンネル数Mに対し2Mの長さを持つが、提案する異なるフィルタ長をもつLOT(ULLOT)では、フィルタ長が2MのものとMのものが混在する。こうしたULLOTに対しても、DCTの高速演算法が適用可能であり、常に高速LOTに比べ計算量が少ないにもかかわらず、それ以上の符号化利得を得ることが可能な場合がある。同時にULLOTは、高域の基底関数を短くすることで、画像符号化の際に問題となるリンギングを抑制できるという利点も持っている。ここではさらに実際のサブバンド画像符号化に適用するため、有限長信号に対するULLOTのサイズ制限構成法を示す。また、ULLOTのGenLOTへの一般化(GenULLOT)についても議論する。, 社団法人電子情報通信学会, 08 Mar. 1999, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 98, 648, 55-62, 0913-5685, 110003280034 - Realization of LOT with Unequal Length Basis Functions and Its Application in Subband Image Coding
NAGAI Takayuki; IKEHARA Masaaki; KANEKO Masahide; KUREMATSU Akira
In this paper, the Lapped Orthogonal Transform (LOT) with unequal length basis functions is considered. The proposed unequal length LOT (ULLOT) has both long basis of length 2M (M denotes number of channels) and short basis of length M, while the lengths of all bases of the conventional LOT are 2M. The fast algorithm for the Discrete Cosine Transform (DCT) facilitates the computation of the ULLOT. Although the computional complexity of the ULLOT is always lower than that of the LOT, there exist some cases where the coding gain of the ULLOT becomes slightly higher than that of the LOT. Its ability to reduce ringing artifacts is an attractive feature as well. The size-limited structure for the finite length signal is investigated and the ULLOTs are tested on image coding application. We also extend the ULLOT to the GenLOT with unequal length basis functionS (GenULLOT)., The Institute of Electronics, Information and Communication Engineers, 08 Mar. 1999, IEICE technical report. Communication systems, 98, 650, 55-62, English, 110003282786, AN10013298 - 異なるフィルタ長をもつ重複直交変換の実現とサブバンド画像符号化への応用
長井隆行; 池原雅章; 金子正秀; 榑松明
本論文では、異なる長さの基底関数をもつ重複直交変換(LOT)について考える。従来のLOTは、すべての基底関数(フィルタ)がチャンネル数Mに対し2Mの長さを持つが、提案する異なるフィルタ長をもつLOT(ULLOT)では、フィルタ長が2MのものとMのものが混在する。こうしたULLOTに対しても、DCTの高速演算法が適用可能であり、常に高速LOTに比べ計算量が少ないにもかかわらず、それ以上の符号化利得を得ることが可能な場合がある。同時にULLOTは、高域の基底関数を短くすることで、画像符号化の際に問題となるリンギングを抑制できるという利点も持っている。ここではさらに実際のサブバンド画像符号化に適用するため、有限長信号に対するULLOTのサイズ制限構成法を示す。また、ULLOTのGenLOTへの一般化(GenULLOT)についても議論する。, 社団法人電子情報通信学会, 08 Mar. 1999, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 98, 646, 55-62, 110003198455 - 光線情報取得のための多眼カメラパラメータの同時推定
馬場健介; 苗村 健; 原島 博; 金子正秀
日本工業出版, Jan. 1999, 画像ラボ, 10, 1, 36-41, Japanese, Introduction other, 0915-6755, 40005023691, AN10164169 - 顔情報処理のための共通プラットホームの構築
八木康史; 森島繁生; 金子正秀; 原島博; 谷内田正彦; 原文雄; 橋本周司
顔画像処理に対する様々な分野での関心の高まりや、工学分野における顔画像処理技術の研究成果の蓄積を背景にして、顔画像処理に関する共通ソフトウェアのツールの作成に向けた活動が進められている。この活動は、「感性擬人化エージェントのための顔情報処理システムの開発」(略称、アドバンストエージェントプロジェクト)と呼ばれ、情報処理振興技術協会(IPA)における独創的情報技術育成事業に関わる開発テーマの一つとして、平成7年度より3年間の計画で精力的に活動を行ってきた。擬人化エージェント技術はさまざまな技術要素から構成されているが、本プロジェクトでは、この中で特に「顔」の役割に着目し、顔画像の認識・合成に関わる顔画像処理システムの開発に主眼をおいた。これと同時に、本システムでは工学のみならず心理学や医学などの分野も含めた顔関連分野における共通の実験用ツールを広く提供することも目標としている。本稿では、平成10年3月で終了するこのプロジェクトの概要と、共通ソフトウェアの紹介を行う。, 社団法人情報処理学会, 19 Mar. 1998, 情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア], 98, 26, 65-72, 0919-6072, 110002674356 - Construction of Standard Software for Face Recognition and Synthesis
MORISHIMA Shigeo; YAGI Yasush; KANEKO Masahide; HARASHIMA Hiroshi; YACHIDA Masahiko; HARA Fumio
The activity for constructing a standard software tool for face image processing is called "Advance Agent Project"and is supported by IPA. This project starts in 1995 and ends in 1998. As a result, the standard software for face recognition and synthesis is completed. This system contributes to the researchers in not only engineering area but also several area like psychologist, medical doctor and dentist., The Institute of Electronics, Information and Communication Engineers, 13 Mar. 1998, Technical report of IEICE. PRMU, 97, 596, 129-136, Japanese, 110003274396, AN10541106 - Efficient Sampling of 3-D Spatial Data by Controlling Camera Positions and Directions
MURAKAMI Tomokazu; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi; ICHIKAWA Tadashi
The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1998, Proceedings of the IEICE General Conference, 1998, 2, 196-196, Japanese, 110003253172, AN10471452 - Multi-User Immersive Stereo
NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1998, Proceedings of the IEICE General Conference, 1998, 362-362, Japanese, 110003261532, AN10471452 - 空間情報の圧縮における画像符号化と空間符号化の比較
高野孝英; 苗村健; 金子正秀; 原島博
社団法人電子情報通信学会, 06 Mar. 1998, 電子情報通信学会総合大会講演論文集, 1998, 2, 110003253003 - Processing of Facial Information by Computer
「顔」は人間にとって非常に身近な存在であると共に, 顔の持ち主である一人一人の人間における個人的な情報, コミュニケーションに係わる情報を始めとした, 言語的手段では表現しにくいようなさまざまな情報を担っている. 近年, 工学分野では主としてコミュニケーションメディアやヒューマンインタフェースへの応用の観点から,「顔」の工学的取扱いに対する研究が活発に行われている. 具体的には, ユーザである人間を対象とした視覚機能をコンピュータにもたせるための顔の認識技術と, コンピュータあるいはコミュニケーションメディアに表現力豊かな顔をもたせるための顔の合成技術である. これらの研究成果は, 従来個別に検討が行われていた顔関連の心理学, 人類学, 美容, 歯科等さまざまな分野においても活用されつつある. 本論文では, このような観点からコンピュータによる顔情報処理に焦点を当て, まず要素技術としての顔画像合成と表情認識について最近の技術動向を概観する. 次に,「顔」の諸特性について考察した後に, 人と人との対面コミュニケーションの支援, 人と機械との間の顔情報を介したコミュニケーションという二つの立場から「顔」の工学的応用について述べる. また,「顔」情報処理の研究のためのツールやデータベース等についても紹介する., The Institute of Electronics, Information and Communication Engineers, 25 Aug. 1997, The Transactions of the Institute of Electronics,Information and Communication Engineers., 80, 8, 2047-2065, Japanese, 0915-1923, 110003227053, AN1007132X - Image Engineering of Human Face and Body. Applications. Advanced Agent with Facial Images.
Kaneko Masahide; Morishima Shigeo
The Institute of Image Information and Television Engineers, 20 Aug. 1997, The Journal of The Institute of Image Information and Television Engineers, 51, 8, 1169-1174, Japanese, 1342-6907, 1881-6908, 110003691676, AN10588970 - A Method to Decide Intensities for Ray-Based Integration of Multiple Sets of Range and Color Data
TAKEUCHI Keisuke; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
距離画像における欠損部分や未撮影部分の補間を目的として、同一物体を異なる条件で撮影した複数の距離画像の統合が検討されている。筆者らは、個別の入出力方式に依存しない3次元画像の記述法である光線記述により距離画像を扱うという立場から、複数の距離画像(輝度値も有するもの)を光線データに変換した上で統合する手法について検討してきた。この手法により、データの上書き等の簡単な処理のみで統合が可能となる。 本稿では、複数の距離画像から得られた光線データの統合に関し、物体の同じ部分の輝度値が、照明等の違いによりデータごとに異なる値をとる場合に、統合による視覚的な違和感を低減するための輝度値決定法について検討する。, The Institute of Electronics, Information and Communication Engineers, 13 Aug. 1997, Proceedings of the Society Conference of IEICE, 1997, 161-161, Japanese, 110003341136, AN10489017 - Redundancy Evaluation of 3-D Spatial Data Based on Ray-Based Description
NAEMURA Takeshi; MURAKAMI Tomokazu; KANEKO Masahide; HARASHIMA Hiroshi
3次元空間の情報を効率的に伝送するためには、その冗長性を効果的に取り除く必要がある。これまで筆者らが検討を進めてきた「空間情報の光線記述方式」においては、近傍の光線情報から容易に補間予測され得る情報よりも、補間予測の困難な情報から優先的に伝送することが望まれる。本稿では、既に取得された光線情報に対して、その情報量 (近傍の情報から補間予測行なう上での困難さ) を定量的に扱う手法について検討する。そして文献で提案した視点探索手法の評価に適用する。, The Institute of Electronics, Information and Communication Engineers, 13 Aug. 1997, Proceedings of the Society Conference of IEICE, 1997, 160-160, Japanese, 110003341135, AN10489017 - Estimation of Hand Gesture using Link Model and Silhouette
KIMURA Tsuyoshi; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
近年、仮想現実感(VR)技術をコミュニケーション環境ヘ応用したシステムの研究が盛んに行なわれている。このようなシステムにおいて、人物の動きを認識する技術は欠くことができない。従来の画像情報を利用した身振り認識研究は、対象が特定、または単純なジェスチャに限定されているものが多い。 筆者らは[2]で簡易形状モデルとシルエットを利用して腕姿勢の推定を行なった。簡易形状モデルとは人体を円筒の組合せによって表現したモデルである。取り扱いは容易であるが、このモデルのシルエットをそのまま用いると、入力人物像とモデルの形状差により推定結果に誤差が生じる原因となっていた。それに対し、本稿では、モデルのスケルトン情報のみを利用し、シルエットについては入力人物像を利用して作成する手法を採用した。また、[2]では静止画のみに対して処理を行なっていたが、本稿では動画に付して処理を行ない、実人物の肘の位置までを含めた腕の姿勢の効率的な推定方法を検討する。, The Institute of Electronics, Information and Communication Engineers, 13 Aug. 1997, Proceedings of the Society Conference of IEICE, 1997, 187-187, Japanese, 110003341474, AN10489017 - Efficient Sampling Method of 3-D Spatial Data Based on Quality Estimation of Ray Interpolation
MURAKAMI Tomokazu; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
3次元空間情報を対象とした通信システムを構築するためには、適切な光線情報を効率的に取得して伝送する必要がある。これまで我々は光線情報に曖昧度の尺度を定義し視点探索の実験を行った。本稿ではより高速に処理でき、安定した視点探索の行える手法を提案する。, The Institute of Electronics, Information and Communication Engineers, 13 Aug. 1997, Proceedings of the Society Conference of IEICE, 1997, 162-162, Japanese, 110003341137, AN10489017 - DCT-based Coding of Ray Data for 3-D Image Communication
TAKANO Takahide; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
We propose a new method of "space coding" to transmit the 3-D space as it is. A multi-dimensional DCT is applied to the 4-D data space in which the ray data is filled densely. Experimental results show the relation between the resolution of 4-D data space and the coding performance., The Institute of Image Information and Television Engineers, 29 Jul. 1997, PROCEEDINGS OF THE ITE ANNUAL CONVENTION, 1997, 1997, 65-66, Japanese, 1343-1846, 110004066752, AA11395540 - 7)複数フレームのマップを用いたレイヤ表現による動画像符号化に関する検討(放送方式研究会)
上田剛弘; 金子正秀; 原島博; 斎藤隆弘
社団法人映像情報メディア学会, 20 Mar. 1997, 映像情報メディア学会誌 : 映像情報メディア, 51, 3, 1342-6907, 110003691458 - Motion Compensated Predictive Coding of Contour Image Sequence with Intraframe Processing
SAKAMAKI Masataka; KANEKO Masahide; HARASHIMA Hiroshi
近年、情報圧縮だけでなく、画像内容の記述や編集・操作など画像情報の総合的な取扱いに対する関心が高まっている。これらの要望を満たす新しい符号化方式の一つとして、構造抽出符号化の研究が進められている。この方式では、対象の形状を表現する輪郭情報、特に動輪郭情報に対する取扱いが重要となる。筆者らはこれまでに動輪郭線の時間的冗長性に着目し、動輪郭線に対して動き補償予測のみ (予測誤差は伝送しない) で符号化を行なう方法について検討してきた。この方法では、情報量の大幅な削減が達成されるが、反面、対象によっては表現精度が低下するという問題がある。本稿では、ブロック毎に動き補償予測で得られる輪郭線と原輪郭線を比較し、誤差の大きいブロックに対してはイントラでチェイン符号化を適用することを考える。基本的には、濃淡動画像におけるインター、イントラ処理の切替と同じ考え方であるが、動輪郭線としての特性を考慮した形で処理を行なう。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 2, 70-70, Japanese, 110003249418, AN10471452 - Compact Description of Moving Image Sequence using Bezier Surface Tubes
UCHIBORI Katsunori; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
画像平面と時間軸によって構成される時空間において、ある一まとまりの意味を持った領域はチューブを形成する。時空間画像を、これを構成する代表的なチューブ群で近似できれば、その断面によってもとの動画像をコンパクトに記述することができる。チューブを表現する方法として、筆者らは、画像の編集・加工における操作性に優れているベジエ曲面を用いる方法について検討している。本稿では、チューブの断面形状が時間軸方向で大きく変化する場合への対処方法について検討する。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 2, 174-174, Japanese, 110003249641, AN10471452 - Real-time Walk-through in the Photo-realistic Virtual Space using Ray-based Description
KUWAKO Yoshikazu; ISHIKAWA Akio; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
近年、仮想空間の中を歩き回るアプリケーションが注目を集めている。しかしVRMLなどではポリゴンモデルを用いているため、特有の見にくさがある。本稿では実画像のリアルさを生かしたウォークスルーの実現に向け、光線に基づく空間記述の概念を用いた手法を検討する。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 2, 175-175, Japanese, 110003249643, AN10471452 - Real-time Ray Based Handling of Object in Surroundings
Virtual Realityの実現のために重要な要素の一つとして、3次元空間の表示・操作に関する手法の開発が挙げられる。リアルな3次元映像を実時間で再構成するためには、光線情報を用いた手法が有効である。本稿では、光線情報の考え方に基づいて、仮想空間中の物体に対する平行移動や回転移動などの操作を、効率的かつ高速に実現する方法について述べる。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 2, 176-176, Japanese, 110003249645, AN10471452 - Estimation of Hand Gesture using Simplfied Shape Model and Silhouette
KIMURA Tsuyoshi; KANEKO Masahide; HARASHIMA Hiroshi
身振りの理解とは、人物の3次元姿勢を再構成できることを意味するが、その際、理解の対象である人間に負担をかけずに計測できることが望ましい。このような観点から2次元画像を利用して身振りを認識する手法が研究されているが、画像内の人物像から身体モデルを生成する際に、肘などの特徴抽出が困難であり、これらを必要としない簡単な身振りの認識に限定しているものが多い。また、シルエットを用いて人物の姿勢を推定する研究が[1]などで既に行なわれているが、処理に時間がかかったり、オクルージョンに対応できないなどの問題点があった。本稿では、人間の上半身のモデルを利用し、入力画像とモデルのシルエットを比較することで、腕の姿勢を効率的に推定する手法について検討する。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 338-338, Japanese, 110003250916, AN10471452 - Real-time Recognition of Facial Expressions for Interactive Kansei Interface
NAKAGAWA Masayuki; KANEKO Masahide; HARASHIMA Hiroshi
最近、マン・マシンインタフェースには、文字や画像、音声などが組み合わされて利用されるようになってきた。インタラクティブ感性インタフェースは、これらに加えてさらに、表情や身振りを人とコンピュータとの間で双方向にやりとりすることによって、より自然で使いやすいインタフェースを実現することを目指している。本稿では、このような感性インタフェースのための実時間表情認識手法を提案する。表情認識を実時間で行う手法としては、DCTを用いる方法[1]や、眉・目・口の縦方向の輝度分布を用いる方法[2]が報告されている。これらの手法に比べて本手法は、低空間周波数画像から得られる大域的な濃淡勾配の時間変化を利用することで、個人差の影響を受けにくく、また、頬の上げ下げもとらえることができるという特徴がある。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 348-348, Japanese, 110003250926, AN10471452 - Non-Linear Image Editing with Command Coding of Moving Image Sequence
OHTA Yoshiyuki; KANEKO Masahide; HARASHIMA Hiroshi
筆者らは、送信者自身が符号化プロセスに積極的に介入しながら動画像を符号化するというインタラクティブコマンド符号化方式について検討している[1]。動画像中での意味内容に沿った構造と各領域の重要度を指示することにより、送信者の意図を反映させた形で画像中の物体形状・動きを単純化して符号化する。本方式では、原画像から復号画像を生成するための種々の描画方法を送受信側双方で共有し、どの描画方法を用いたかを示す識別コードと必要なパラメータをコマンドとして並べたものが、符号化データとして送受される。画像上の各物体の形状・テクスチャ・動きは別々のコマンドで指定されており、復号側でコマンド自身を変更したり、パラメータを変更することで、原画とは異なった画像を生成することが可能である。本稿では、コマンドの内容の変更に基づくノンリニアな画像編集について述べる。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 375-375, Japanese, 110003250953, AN10471452 - Interactive Coding Method by Controlling Temporal and Spatial Resolution in Each Region
YAMADA Yoshihisa; KANEKO Masahide; HARASHIMA Hiroshi
実時間・自動処理を前提とした従来の動画像符号化の枠組みから離れた新しい符号化手法として、筆者らは、送信者のマニュアル操作を積極的に利用する「インタラクティブ符号化」の概念を提唱した。その適用対象の一つとして符号化制御を取り上げ、領域単位に前処理・量子化制御の手法を選択する「インタラクティブ符号化制御」の検討を進めている。従来の符号化制御手法は、原画像全体をできるかぎり忠実に符号化することを目指す、という信号処理の観点から行われていた。これに対し、インタラクティブ符号化制御手法では、画像を観察した送信者が領域毎に情報としての重要度を判定し、重要度の高い領域には多くの符号量を与えて高画質な復号画像が得られるようにし、逆に重要度の低い領域からは符号量を削減して高圧縮を目指す。すなわち、送信者の望んだ画質を得るという観点から符号化効率の改善が図られる。重要度の低い領域に対して、Low Pass Filterを用いて空間解像度を低下させることにより符号量の削減を図る手法については既に報告を行った。本稿では、領域毎に時間解像度に差を設けることによる符号化効率の改善について、実験結果と共に報告する。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 2, 37-37, Japanese, 110003249349, AN10471452 - Improvement of Robustness in Estimation of 3-D Head Motion
PARK Minchul; KANEKO Masahide; HARASHIMA Hiroshi
顔動画像における人物頭部の3次元的な動きの分析は、モデルベース符号化の他、擬人化エージェント、仮想現実感などのヒューマンインタフェース分野への応用を目的として従来より盛んに研究されている。本稿では、正しい動き情報を持っている画素を選択して頭部の動きを検出する方法と動きパラメータを利用して奥行き座標の更新を行なう方法を用いることによって、眼鏡を掛けており、かつ大きな動きを含むシーケンスに対しても適用できるロバストな動き推定方法について述べる。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 340-340, Japanese, 110003250918, AN10471452 - Processing of Profile Information using 3-D Wireframe Model of Head
TANABE Akira; KANEKO Masahide; HARASHIMA Hiroshi
顔画像に関しては、正面顔を対象として様々な観点から研究が行われてきている。一方、横顔については、額から鼻を経て顎に至る輪郭線を対象とした研究[1]や、頭部の標準的な3次元形状モデルを特定の人物の正面・横顔に整合させる方法に関する研究[2]などが報告されているが、正面顔に比べると必ずしも十分に研究されているとは言えない状況にある。本稿では、横顔が持つ独自の特徴を多角的に検討するための方法について述べる。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 349-349, Japanese, 110003250927, AN10471452 - Facial Caricature by Computer with Preserving Touch of Individual Painter
HANAOKA Goichiro; KANEKO Masahide; HARASHIMA Hiroshi
似顔絵は、対象人物の特徴を簡潔に表現したものとして、また、実写の写真とは違った形での描写形態として、様々な場面で用いられている。ところで、一口に似顔絵といっても描き手によって似顔絵の画調は異なり、同一人物に対しても様々な似顔絵が描かれている。計算機による似顔絵の生成に関しては、これまで、対象人物の顔と平均的な顔との差を強調する方法が主にとられているが[1]、特定の描き手の画調を表現することは必ずしも容易ではないっ本稿では、実写の顔画像と似顔絵の各々で構成される空間に対して直交基底展開[2]を行ない、両者を対応付けることによって計算機上で任意の描き手の画調で、任意の人物の似顔絵を自動生成する方法について述べる。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 354-354, Japanese, 110003250932, AN10471452 - Low Bitrate Video Coding Method using Planar Representation with Temporal Division
UEDA Yoshihiro; KANEKO Masahide; SAITO Takahiro; HARASHIMA Hiroshi
領域分割された動画像に対して, 領域毎にテクスチャ変化に応じた時間軸方向での分割を行い, 平面記述を用いて符号化する手法を提案する. 従来手法に対して, レイヤ表現だけでなくセッティング表現も適用すると共に, キーフレーム位置の設定および領域形状の符号化方法を改善し, H.263と符号化性能を比較した結果を報告する., The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 2, 39-39, Japanese, 110003249353, AN10471452 - A Motion Data Exchange for Interactive Model-Based Coding
Ohzeki Kazuo; Saito Takahiro; Kaneko Masahide; Harashima Hiroshi
筆者らは, インターネットのホームページなどに顔動画像を組み込んだ, ハイパーメディアに対するインタラクティブ符号化方式について検討している[1]. 単眼カメラで撮像された2次元画面上の12個の特徴点をインタラクティブに与え, 3次元のダローバルな動きパラメータの検出を行う[2]. 目, 口などのローカルな動きパラメータは, 非剛体としての歪みを含めた記述を行う. ここでは, インタラクティブ知的符号化システムにおける動き情報ファイルの入れ替えに関し, ローカル動きの記述方式との関連を検討し, 個人ごとに異なる形状と動きが容易に記述できる適応的なローカル動き記述方式の提案を行う., The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 374-374, Japanese, 110003250952, AN10471452 - Simultaneous Estimation of Multiview Camera Parameters for Acquisition of Ray Data
BABA Kensuke; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
様々な3次元画像の統一的な記述を目的として、光線に着目した空間記述方式が提案されている。本稿では、多眼カメラによって撮影された画像情報を光線情報に変換するために必要なカメラパラメータ (視点位置、視線方向、焦点距離) の推定手法について検討する。まず、カメラの焦点距離を固定して、様々な視点位置・視線方向で対象の撮影を行なう。次に、全ての画像における焦点距離が等しいという拘束条件の下で、カメラパラメータを推定する。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 2, 177-177, Japanese, 110003249647, AN10471452 - Real-time Gesture Recognition using Position and Shape of Color Regions
KONDO Hirohito; KANEKO Masahide; HARASHIMA Hiroshi
コミュニケーションの手段として補助的役割を担う「身振り」を計算機によって認識させる事は、計算機と人との間のより良いインタフェースの実現のために重要である。2次元画像からの身振りの認識としては、例えば二値画像のパターンマッチングによる方法[1]などが報告されている。本稿では、色情報により領域分割された画像に対し、人体の形状に関する知識を利用した処理を施すことにより、実時間で身振り認識を行う手法について述べる。, The Institute of Electronics, Information and Communication Engineers, 06 Mar. 1997, Proceedings of the IEICE General Conference, 1997, 339-339, Japanese, 110003250917, AN10471452 - 計算機による頭蓋骨からの顔面形状の復元
大久保千英; 金子正秀; 原島博
人物頭部の3次元形状モデルを用いた顔画像の認識・合成に関する研究が、これまで盛んに行なわれてきている。従来用いられている3次元形状モデルは、顔を中心とした頭部の表面形状を表現したものである。一方、解剖学的には、頭部は大きく頭蓋骨、筋肉、皮膚(表面)の3つから構成される。表面形状だけでなく、頭蓋骨や筋肉までを含めた取り扱いが可能になれば、顔に関連したより幅広い研究の進展が期待できる。このような観点からの取り組みの第一歩として、本稿では頭蓋骨と表面形状を相互に関連付けて取り扱う方法について検討する。, 社団法人電子情報通信学会, 06 Mar. 1997, 電子情報通信学会総合大会講演論文集, 1997, 110003250928 - Command Coding of Moving Image Sequence Using its Semantic Structure Indicated through User Interactions
OHTA Yoshiyuki; KANEKO Masahide; HARASHIMA Hiroshi
This paper proposes a new coding method "Interactive Command Coding" based on the new image coding paradigm of "Non-realtime Procedure & With Human Interactive Operations". The proposed method allows a human to indicate the semantic structure of moving image sequence through interactive operations. An original image sequence is simplified so that it can be encoded at very low bitrate while preserving what the origical image sequence tells. Encoded data consist of a set of commands. Each command describes attributes of the objects in the simplified image sequence. A non-linear image editing system is also shown as one of the useful applications of the proposed method., The Institute of Electronics, Information and Communication Engineers, 21 Feb. 1997, IEICE technical report. Image engineering, 96, 544, 31-36, Japanese, 110003194719, AN10013006 - Description of Structured Abstract Index Images with Cubic Bezier Surface Tubes in Spatiotemporal Images
UCHIBORI Katsunori; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
This paper proposes a new description method of spatiotemporal images based on the concept of structured abstract index images. In spatiotemporal images, each region in an image sequence forms a tube. An original image sequence can be reconstructed by cutting out the sequence of cross sections from the group of tubes in spatiotemporal images. That is, a moving image sequence can be described compactly by the group of tubes. This paper first discusses the approximation of static contours by Bezier curves. The approximation of surface tubes by Bezier surface is examined in detail. In the case that the shape of cross section changes largely along the time axis, these methods do not work well. This problem can be solved by growing a new Bezier surface from passing points of Bezier curve and by combining multiple Bezier surfaces., The Institute of Electronics, Information and Communication Engineers, 21 Feb. 1997, IEICE technical report. Image engineering, 96, 544, 23-29, Japanese, 110003194718, AN10013006 - Interpolation of Missing Data in a Ray Space using Multiple Sets of Range and Texture Data
TAKEUCHI Keisuke; KANEKO Masahide; HARASHIMA Hiroshi
Ray-based description of 3-D information enables to construct a virtual space with environment and objects, which are obtained from various kinds of input devices. A range finder gives both texture and range data of object, but a lack of data due to occlusion and constraint imposed by device itself will be a serious problem. To reduce this lack, some methods to integrate multiple sets of range and texture data obtained from the same object located on different positions, have been proposed. These methods aim at the reconstruction of 3-D structure, thus accurate integration and complex processing are required. In this paper, we propose a new algorithm to interpolate missing data. Multiple sets of range data are translated into ray information and are integrated using a method like "image-based rendering". Using this algorithm, we can obtain an interpolated object data, with neither complex processings nor increase of data and calculation., The Institute of Electronics, Information and Communication Engineers, 20 Dec. 1996, Technical report of IEICE. PRMU, 96, 436, 51-58, Japanese, 110003274606, AN10541106 - 複数の距離画像を用いた光線空間における欠損情報の補間
竹内敬亮; 金子正秀; 原島博
光線群に基づいた3次元情報記述により,多眼カメラやレンジファインダなど,各種入力デバイスからのデータを融合した仮想空間の構築が可能となる.レンジファインダを利用する場合にはテクスチャと距離情報を同時に取得できるが,オクルージョンや装置の原理的制約による情報の欠損が問題となる.この問題に対し,同一の被写体に対して位置や向きを変えて撮像した複数の距離画像を用いて3次元形状復元を行なう従来手法では,3次元モデルの厳密な統合が必要となる.これに対し,本稿では,複数の距離画像を光線群データに変換し,光線空間レベルで統合処理を行なう.これにより,厳密な統合処理を必要とせず,かつ統合に伴う情報量やレンダリング時の演算量の増加も抑えながら,欠損情報が補間された3次元画像を再現できる., 社団法人情報処理学会, 19 Dec. 1996, 情報処理学会研究報告. グラフィクスとCAD研究会報告, 96, 125, 93-100, 0919-6072, 110002781111 - A New Video Coding Method using Multi-frame Maps with Layered Representation
UEDA Yoshihiro; KANEKO Masahide; SAITO Takahiro; HARASHIMA Hiroshi
This paper presents a new coding method modifying the conventional layered representation, which describes moving images with overlapping layers stacked in their order of depth. For each segmented region, the layer consists of three maps which are usually generated by integrating all frames into one key frame. However, it is not enough to use only one intensity map for encoding a region in long sequence, because distortion of the map arises from motion estimation errors and transition of texture. To overcome this problem, we split image sequence into some short sequences of unequal length, and reconstruct sequence by mixturing multiple maps of key frames. Simulation results show that the proposed coding method achieves better visual quality compared to the conventional H. 263 method., The Institute of Image Information and Television Engineers, 13 Dec. 1996, ITEJ Technical Report, 20, 70, 37-42, Japanese, 0386-4227, 110003680675, AN00352231 - 7-8 参照フレーム形成による頭部の3次元動き推定
朴〓徹; 金子正秀; 原島博
社団法人映像情報メディア学会, 04 Dec. 1996, テレビジョン学会映像メディア部門冬季大会講演予稿集, 1996, 1342-0402, 110003672413 - 4-9 トップダウン指向のインタラクティブ操作による動画像のコマンド符号化
太田善之; 金子正秀; 原島博
社団法人映像情報メディア学会, 04 Dec. 1996, テレビジョン学会映像メディア部門冬季大会講演予稿集, 1996, 1342-0402, 110003672385 - Detection of 3-D Motion Parameters for the Interactive Model-based Coding of Facial Image Sequence
OHZEKI Kazuo; SAITO Takahiro; KANEKO Masahide; HARASHIMA Hiroshi
This paper presents a new method to analyze motion parameters for an interactive model-based coding of face images in the application of storage media, multimedia e-mail and WWW. In such applications, it is not necessary to encode input sequences in realtime. This will allows the introduction of interactive operations in the model-based coding. To cope with the difficulties in full automatic image recognition, the authors have confined the general situation of image recognition to a restricted one with interactive operation. It is a kind of mid-level stage where we can analyze reliable 2-D feature points to obtain 3-D motion parameters. Under the above concept of interactive model-based coding, a new motion detection algorithm has been developed using feature points, which an operator indicates interactively. In this paper, depth value of initial wireframe model is analyzed together with other unknown parameters. The depth value is considered to be well obtained for a part of sequence having large rotational motion. Based on this algorithm, global motion parameters together with local motion parameters are detected for face image sequences. An experimental transmission of model-based coded data through the internet is tried. The synthesized image sequence shows that the detected parameters give the smooth and natural motion of face., The Institute of Electronics, Information and Communication Engineers, 22 Nov. 1996, Technical report of IEICE. Multimedia and virtual environment, 96, 390, 17-24, Japanese, 110003270572, AN10476092 - 10)マニュアル操作ツールを備えたMPEGエンコーダによる画質改善効果の検証(ヒューマンインフォメーション研究会)
山田悦久; 金子正秀; 原島博
社団法人映像情報メディア学会, 20 Oct. 1996, テレビジョン学会誌, 50, 10, 0386-6831, 110003673484 - インタラクティブ符号化のためのマニュアル操作を利用した領域分割手法
山田悦久; 金子正秀; 原島博
実時間・自動処理が前提となっている従来の画像符号化の枠組みから離れ、送信者のマニュアル操作を積極的に利用する「インタラクティブ符号化」という新たな符号化手法の検討を進めている。インタラクティプ符号化は、符号化対象となる入力画像をSNR評価尺度の下に忠実に符号化することを目指すのではなく、送信者がマニュアル操作を用いて符号化プロセスに積極的に関与し、画像の分析・編集を行ったり符号化の制御を行い、送信者の意図が相手側に伝わるように符号化することを第一義とするものである。この場合、画像に対する操作は意味を持った領域単位で行ったほうが、操作性・符号化効率の双方の点からより好ましい。本稿では、インタラクティブ符号化のための領域分割手法として、送信者のマニュアル操作を利用することによって、自動処理による分割手法よりも簡便に領域抽出・追従を行う手法について検討する。, 社団法人電子情報通信学会, 18 Sep. 1996, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 110003336530 - Construction of Ray Space using Range Data
TAKEUCHI Keisuke; KANEKO Masahide; HARASHIMA Hiroshi
個別の入出力方式に依存しない3次元情報の記述法として光線空間が提唱され、多眼画像やホログラムデータから光線空間を構築する研究が行なわれている。レンジファインダから得られる距離データとテクスチャデータ(以下、単にレンジデータと表記)についても、光線空間への変換が可能となれば、レンジファインダを形状計測のみならず3次元画像の取得の一手段として利用可能となる。本稿では、レンジデータに基づく光線空間の構築手法について検討する。, The Institute of Electronics, Information and Communication Engineers, 18 Sep. 1996, Proceedings of the Society Conference of IEICE, 1996, 304-304, Japanese, 110003336601, AN10489017 - 3次元モデルを用いたインタラクティブ顔画像合成システム
中川督之; 大場敏文; デロワオリビエ; 金子正秀; 原島博
近年計算機ハードウェア技術の進歩により、コンピュータ・グラフィックス(CG)の映像が映画やテレビ放送などで盛んに利用されるようになってきた。また、レングリング技術の発達により、本物と見分けがつかないほどの質感や動きが実現されてきている。しかし、人物顔における肌の質感表現や表情表出に関しては、その表現力にまだ課題が残されている。筆者らは、これまで顔動画像の分析合成符号化の実現に向けて様々な観点から研究を進めてきた.本稿では、この中で確立された顔画像の合成技術を利用して、肌の質感や表情をインタラクティブにコントロールしながら、自然な人物顔画像を合成するシステムについて述べる。, 社団法人電子情報通信学会, 18 Sep. 1996, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 342-343, 110003337132 - 光線空間情報取得のための移動単眼撮像システムの開発
石川彰夫; 苗村健; 金子正秀; 原島博
近年、三次元空間情報を統一的に記述する手法として「光線空間」の概念が注目されている。光線空聞を獲得するための入力手段の1つとして、多眼画像の利用が挙げられる。光線空間の構築に際しては、各視点からの画像の位置関係が分かっている必要があり、多眼画像の撮像時に視点の位置及び方向が正確に求められていることが要求される。このような観点から、筆者らは、視点情報が正確に定まった多眼画像を、コンピュータ制御された移動単眼カメラによって、自動的に撮像するシステムを開発した。本稿では、本システムの概要について述べる。, 社団法人電子情報通信学会, 18 Sep. 1996, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 110003336600 - 形状特徴と濃淡特徴の融合処理に基づく曲面の効率的三角形パッチ表現
松崎弘; 金子正秀; 原島博
距離画像からの3次元形状のモデリングに関しては,情報量の圧縮や、表示速度の観点から効率的な三角形パッチ表現法が望まれており、[1]、[2]を始めとした研究が多数行われている。これらでは、曲率等、形状特徴により三角形パッチの大きさを決める手法が主に用いられている。ところで、実際の立体認識では、物体の形状情報と色情報の双方を利用していると思われ、各々の特徴を融合させて処理を行うことによって、より適切な三角形パッチを生成できることが期待される。本研究では、曲率等の形状特徴に加え、濃淡情報から得られる特徴を融合させた特徴量を用いることにより、三角形パッチによる3次元形状表現を効率的に行う方法について検討する。, 社団法人電子情報通信学会, 18 Sep. 1996, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 110003336715 - 動画像のインタラクティブコマンド符号化 : 階層化したコマンドについての検討
太田善之; 金子正秀; 原島博
動画像においてその画像の意味内容(あるいは画像を用いて送信者が伝えたい内容)に沿った構造と意味内容に寄与する各領域の重要度を、人間がインタラクティブ操作によって指示することにより、画像の意味内容を保存したまま画像中の物体形状・動きを単純化して符号化することが可能である。この場合、送信者自身が符号化プロセスに積極的に介入することができるという特徴がある。画像内容の単純化には、原画に忠実なテクスチャを生成する方法から、原画に描かれている物体の概念(セマンティクス)を考慮した抽象度の高い方法まで様々なものが考えられる。本稿では、同一の領域に対して表現レベルの異なる複数のコマンドを用意すると共に、これらのコマンドに階層性を持たせたコマンド符号化について述べる。, 社団法人電子情報通信学会, 18 Sep. 1996, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 110003337072 - Fast Rendering Algorithm for Converting Multi-View Panoramic Images into Ray-Based Description of Real World
NAEMURA Takashi; KANEKO Masahide; HARASHIMA Hiroshi
光線を単位として空間情報を記述することにより、個別の表示技術に依存しない中立的な形での3次元空間の記述が可能となる。筆者らは、この概念に基づき、観察者を取り囲む空間の記述も可能な手法を提案してきた。本稿では、パノラマ画像から、光線に基づく空間記述を得る方法について述べ、その高速化手法を検討する。, The Institute of Electronics, Information and Communication Engineers, 18 Sep. 1996, Proceedings of the Society Conference of IEICE, 1996, 302-302, Japanese, 110003336599, AN10489017 - 5)インタラクティブ操作ツールを備えたMPEGエンコーダシミュレータの開発(ネットワーク映像メディア研究会)
山田悦久; 金子正秀; 原島博
社団法人映像情報メディア学会, 20 Jul. 1996, テレビジョン学会誌, 50, 7, 0386-6831, 110003673976 - Description of Moving Image Sequence with Setting Representation
UEDA Yoshihiro; KANEKO Masahide; SAITO Takahiro; HARASHIMA Hiroshi
This paper presents a description method of moving image sequence with the setting representation. For the purpose of describing motion information efficiently, we integrate some regions, which don't have the same motion on 2-D image planes, to describe with one 3-D motion parameter. Simulation results indicate that the setting representation gives better performance for motion description compared with the 2-D layered representation., The Institute of Image Information and Television Engineers, 17 Jul. 1996, Proceedings of The ITE Annual Convention, 32, 32, 319-320, Japanese, 0919-1879, 110004779128 - MPEG Encoding Simulator for Enhancing the Image Quality by Manual Operation
YAMADA Yoshihisa; KANEKO Masahide; HARASHIMA Hiroshi
A new simulator for MPEG encoder with interactive manipulating tools has been developed. The operator selects the method of preprocessing filter and the quality class for each segmented region. Important region is quantized by high accuracy, and residual region is encoded with low quality. In this simulator, a standard MPEG decoder can decode high quality image which operator desires., The Institute of Image Information and Television Engineers, 17 Jul. 1996, Proceedings of The ITE Annual Convention, 32, 32, 348-349, Japanese, 0919-1879, 110004779144 - Effect of Enhancing the Image Quality by MPEG Encoding Simulator with Manual Operating Tools
YAMADA Yoshihisa; KANEKO Masahide; HARASHIMA Hiroshi
A new simulator for MPEC-1 encoder with interactive manual operating tools has been developed. The operator of this simulator can select the type of preprocessing filters and the quality level for each segmented region. A large amount of code is allocated to significant regions (ex. person, important subject). However in unsignificant regions (ex. background), high frequency components are removed using low pass filter and a small amount of codes is allocated. Effectiveness of this simulator is verified by computer simulation., The Institute of Image Information and Television Engineers, 21 Jun. 1996, ITEJ Technical Report, 20, 39, 57-62, Japanese, 0386-4227, 110003680338, AN00352231 - マニュアル操作ツールを備えたMPEGエンコーダによる画質改善効果の検証
山田悦久; 金子正秀; 原島博
MPEG-1方式を用いて映像信号を符号化する際に、マニュアル操作により画質改善・符号量の制御をインタラクティブに行うことのできるシミュレータの開発を進めている。符号化を実行する操作者が各領域ごとの重要度を判断しながら、前処理フィルタの選択や量子化スケールの重み付けをの設定を行う。この結果、不要と判断した領域からは符号が削減され、重要な領域に対してはより多くの符号が与えられる。シミュレーション実験を行い、本手法による復号画像の画質改善効果を検証した。, 社団法人電子情報通信学会, 21 Jun. 1996, 電子情報通信学会技術研究報告. IE, 画像工学, 96, 116, 57-62, 110003194771 - 10)動画像の階層構造表現のための構造情報の抽出(放送方式研究会)
鄭且根; 相澤清晴; 金子正秀; 原島博; 斎藤隆弘
社団法人映像情報メディア学会, 20 Apr. 1996, テレビジョン学会誌, 50, 4, 0386-6831, 110003705499 - Modeling and Synthesis of Hand Gesture
Kimura Tsuyoshi; Kaneko Masahide; Harashima Hiroshi
「身振り」は、非言語手段によるコミュニケーションの一つとして、重要な役割を果たしている。本稿では、人間の体にスケルトンモデルを当てはめ、身振り情報を簡潔に符号化する手法について検討する。これにより擬人化エージェントシステムや分析合成符号化による画像通信システム、手話および身振り辞書などへの応用を考える。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 405-405, Japanese, 110003242813, AN10471452 - 3次元構造モデルを介した光線空間操作の基礎検討
内山暁彦; 苗村健; 金子正秀; 原島博
光線空間によって記述された3次元画像に操作を加える場合、従来のCGで用いられているような「構造データ+テクスチャ」に完全に置き換えてしまうと、光線空間を介して表現することの利点を生かせない。構造データはユーザが編集操作をするためのインタフェースとして用い、実際のデータ操作は光線空間の上で直接行なうことが望ましい。本稿では以上のような方針に基づき、三角形パッチモデルをユーザインタフェースとして、多眼画像の内容を操作する方法について検討する。, 社団法人電子情報通信学会, 11 Mar. 1996, 電子情報通信学会総合大会講演論文集, 1996, 2, 110003246707 - Reconstruction of Natural 3-D Object Images using Ray Space
Yanagisawa Takeyuki; Naemura Takeshi; Kaneko Masahide; Harashima Hiroshi
Virtual Reality(VR)空間の構築のためには、これまで主として幾何モデルベースとしたComputer Graphics(CG)技術が用いられてきた。しかし、従来のCG手法では、独特の人工的な感触が生じてしまう。本稿では、多眼3次元画像から構築される「光線空間」に基づいて、自然な3次元物体画像を再構成する方法について検討する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 203-203, Japanese, 110003246709, AN10471452 - Efficient Sampling of Ray Space Based on Ambiguity Estimation
Murakami Tomokazu; Naemura Takeshi; Kaneko Masahide; Harashima Hiroshi
3次元空間情報の伝送のためには、光線の集まりとして取り扱う方法が有効である。しかし、実際には適切な光線情報をいかに取得するかが問題となる。本稿では、移動カメラによる光線情報の効率的な取得について検討する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 205-205, Japanese, 110003246713, AN10471452 - Motion Analysis for Interactive Model-based Coding
Ohzeki Kazuo; Saito Takahiro; Kaneko Masahide; Harashima Hiroshi
筆者らは、蓄積系メディア、電子メール等の非実時間通信環境における顔動画像のインタラクティブ符号化方式について検討している。顔動画像においては頭部全体の3次元的な動きに対する取り扱いが不可欠である。2D動画像から3D動きパラメータを抽出する方法として、平行移動と回転成分を分離して検出するなどの方式が示されている。ここでは、インタラクティブに入力された特徴点を用いて回転と平行移動を同時に求める方式における雑音除去について検討を行ったので報告する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 397-397, Japanese, 110003242805, AN10471452 - Estimation of 3-D Parameters for Planar Representation of Moving Images
Ueda Yoshihiro; Kaneko Masahide; Saito Takahiro; Harashima Hiroshi
レイヤー表現を3次元情報が扱えるように拡張したセッティング表現[1]では,平面を3次元空間中に配置し,3次元剛体運動モデルを用いて動かすことにより,動画像を記述することができる。本稿では,隣接するフレームを用いた従来の推定手法[2]を,複数フレームに対して,条件を付加しながら繰り返し適用することにより,安定した3次元の奥行きおよび剛体運動パラメータを抽出する手法について述べる。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 96-96, Japanese, 110003246482, AN10471452 - Building Photorealistic Cyberspace Based on Ray-Space Theory (1) : Blending Geometric Rendering and Ray-Space Rendering
Uchiyamat S.; Katayama A.; Tamura H.; Naemura T.; Kaneko M.; Harashima H.
現在のバーチャルリアリティシステムのほとんどは,CGの幾何モデルデータを用いて仮想環境や物体を表現している.明示的に形状モデルをもつことは,物体の操作には好都合であるが,視覚的な写実性を高めるには実写画像の効果的利用が期待されている.本稿では,幾何形状モデルで表現された仮想環境に,複雑な形状をもった物体を実画像を基にした光線空間データで表現し,それらを融合する手法について提案する., The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 188-188, Japanese, 110003246677, AN10471452 - Analysis of 3-D Motion Caused byFacial Expression
Yamamoto Koji; Kaneko Masahide; Harashima Hiroshi
コンピュータのヒューマンインターフェースヘの適用を始めとして、顔の表情の分析・合成に関する研究が盛んになっている。しかし、3次元空間内での定量的な動きや時間変化まで扱っている例は少ない。従来の研究としては、オプティカルフローを用いて、顔部品の位置を検出し、表情変化に伴うエネルギーの分布を示した方法やマーカを用いて3次元的に顔を計測し表情を再現する方法などがある。本研究では、顔に格子模様を描き、正面及び側面から格子点位置の動きを追跡することによって、表情表出に伴う3次元的な動きデータを得る方法について検討する。また、一つの表情が形成される過程の時間的変化についても解析する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 383-383, Japanese, 110003242791, AN10471452 - Interactive Image Sequence Coding Using Abstract Index Images
Okumiya Keiji; Kaneko Masahide; Harashima Hiroshi
近年、動画像符号化の分野においては、従来の波形符号化における単なる情報圧縮ということだけでなく、多様な映像利用に適用できるような符号化技術の研究開発が要望されている。これまで、筆者らは、P型記述子やプリミティブ図形による抽象化索引映像の作成について検討を行ってきた。本稿では、抽象化索引映像を利用することにより、受信者側の意図を復号結果に反映させることのできるインタラクティブ動画像符号化について検討する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 396-396, Japanese, 110003242804, AN10471452 - Fractal Coding in Wavelet Space
Bochez Karl; Kaneko Masahide; Harashima Hiroshi
Recent publications [1] have demonstrated a new approach for efficiently (self-)quantizing coefficients of a wavelet transformed image. In the present paper, we prove that the classical fractal encoding approach can be extended to the space of the wavelet coefficients with a great improvement in the quality of decoded image., The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 71-71, English, 110003246426, AN10471452 - Texture Synthesis for 3-D Structural Models Using Order Statistic Filters
Naemura Takeshi; Yanagisawa Takeyuki; Kaneko Masahide; Harashima Hiroshi
3次元画像の記述法として、被写体の構造に着目する手法が検討されている。しかし、被写体の構造を厳密に推定することは難しく、3次元画像の正確な伝送には、解決すべき課題が山積している。本稿では、微細な構造の推定には立ち入らずに、正確な情報伝送よりも、視覚的に良好な画像の合成を優先する。具体的には、CGモデルに張り付けるテクスチャ情報の決定法について検討する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 201-201, Japanese, 110003246705, AN10471452 - Removal and Modeling of Specular Reflection in the Ray Space
Hebiishi Takeshi; Naemura Takeshi; Kaneko Masahide; Harashima Hiroshi
「3次元統合画像通信」の構想に基づく柔軟な空間記述法として「光線空間」の概念が提案されている。これまで、「実空間中のある点の色は、視点位置を変えても変化しない(以下、ランバート則と呼ぶ)」という仮定のもとで解析が行なわれてきた。本稿では、ランバート則が成り立たない場合のモデル化について検討する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 204-204, Japanese, 110003246711, AN10471452 - Motion Compensated Prediction of Multi-view Video Using the Concept of Ray Space
Kotake Daisuke; Naemura Takeshi; Kaneko Masahide; Harashima Hiroshi
3次元動画像の情報圧縮に関しては、これまでステレオ動画像を対象とした研究が多数行なわれている。本稿では、光線空間の冗長性を利用した多眼動画像の動き補償予測について検討する。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 206-206, Japanese, 110003246715, AN10471452 - 時空間画像の階層化による領域分割手法の検討
山田悦久; 金子正秀; 原島博
近年ミッドレベル符号化の研究が活発である。波形レベルでの処理を行う従来のローレベル符号化とは異なり、ミッドレベル符号化では領域毎に最適な手法・パラメータを選択することができるため、より高度な映像処理・符号化の実現が可能である。この様な観点から、符号化分野においても映像の領域分割に対するニーズが高まってきている。筆者らは、複数のフレームを一括して扱う時空間画像上における領域分割手法の検討を行っている。本稿では、時間軸方向に対する階層構造を導入して領域抽出手法の安定性を高める方式について検討する。, 社団法人電子情報通信学会, 11 Mar. 1996, 電子情報通信学会総合大会講演論文集, 1996, 2, 110003246990 - Interactive Command Coding of moving Image Sequence :Enhancement of Image Editting Functions
Ohta Yoshiyuki; Kaneko Masahide; Harashima Hiroshi
筆者らは現在、「実時間・全自動」という従来の符号化パラダイムから一旦離れ、「非実時間・インタラクティブ操作」という前提のもとで、画像の意味内容を抽出する符号化方式について検討している。低レートでの画像符号化では、画素値そのものを忠実に再現するのは不可能である。原画像が伝えたい意味内容を復号画像においてどれだけ再現できるかが重要になる。そこで、本符号化方式では、動画像においてその画像の意味内容(あるいは画像を用いて人間が伝えたい内容)に沿った構造と意味内容に寄与する各領域の重要度を、人間がインタラクティブ操作によって指示する。さらに、個性や創造性を発揮し意味内容を保存したまま原画像中の物体の形状・動きを単純化することで、低ビットレートを実現しようとしている。本符号化では、特定のモデルを利用せず、与えられた原画像をユーザの意図によって編集することで、任意の画像について符号化を行なうことができる。一方、扱う画像の性質によって単純化の方法には様々なものがある。本稿では、任意画像の符号化を可能にするため、様々な編集機能を簡単に組込むことを可能にしたシステム構成について述べる。, The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 398-398, Japanese, 110003242806, AN10471452 - Building Photorealistic Cyberspace Based on Ray-Space Theory (2) : Reconstruction of Arbitrary Viewpoint Images from Turbine-Shaped Base-Planes
Tayama A.; Uchiyama S.; Tamura H.; Naemura T.; Kaneko M.; Harasima H.
ある面(基準面)を通過する光線の集合として実空間を表現する光線空間理論が提案されている.これまでは主に,基準面に一枚の平面を用いて観察者の視点位置に応じた画像を生成する手法が検討されてきた.この場合,基準面よりも光線進行方向側の視点位置でしか画像を生成できないといった制約がある.本稿では,複数の基準面を水車型に配置することにより,視点位置に制約のない画像を生成できるように手法の拡張を行ったので報告する., The Institute of Electronics, Information and Communication Engineers, 11 Mar. 1996, Proceedings of the IEICE General Conference, 1996, 2, 189-189, Japanese, 110003246679, AN10471452 - Development of MPEG Encoding Simulator with Interactive Manipulating Tools
YAMADA Yoshihisa; KANEKO Masahide; HARASHIMA Hiroshi
This paper describes a new simulator for MPEG encoder with interactive manipulating tools. In this simulator, the sender estimates whether each segment of images is important or not, and select the methods of preprocessing and the quality classes for each segment interactively. This simulator can produce higher quality decoded images than those obtained by automatic encoding., The Institute of Image Information and Television Engineers, 29 Feb. 1996, ITEJ Technical Report, 20, 14, 25-30, Japanese, 0386-4227, 110003680098, AN00352231 - Generation of Abstract Index Images from Moving Image Sequence and its Application
We have already proposed the concept of hierarchical representation of scenes and of abstract index images from the viewpoint of the abstraction of the image contents. Abstract index images show the outline of the original sequence, and can be applied to facilitate tasks such as coding, editing, summarizing the essence of image sequences, and so on. In this paper, we generate abstract index images by using the shape decomposition with primitive figures. The use of primitive figures enables a compact description that contains the general structural information. We also investigate applications which use abstract index images., The Institute of Electronics, Information and Communication Engineers, 23 Feb. 1996, IEICE technical report. Image engineering, 95, 533, 1-8, Japanese, 110003194889, AN10013006 - Motion Detection for Interactive Model-based Coding
OHZEKI Kazuo; SAITO Takahiro; KANEKO Masahide; HARASHIMA Hiroshi
This paper presents a new method to analyze motion parameters for an interactive model-based coding of face images in the application of storage media, multimedia e-mail and WWW. In such applications, it is not necessary to encode input sequences in realtime. This will allows the introduction of interactive operations in the model-based coding. It will solve image recognition problems in model-based coding. It will enhance the performance of model-based coding with giving new signal processing, such as the treatment of eyeglass frame and beards. It will also provide a new signal processing to combine editing or creating face features and coding of face images. Under the above concept of interactive model-based coding, a new motion estimation algorithm was developed using feature points, which an operator indicates interactively. Based on this algorithm, two practical approximation methods are compared with each other. Moreover, input noise induced through mouse interface was analyzed. A distance-preserving filter was used to reduce the input noise. Motion parameters were detected using this algorithm for face image sequences. The wireframe of the first picture of the motion sequence was transformed and shifted according to the rotation and translate parameters. The resulted wireframes coincide with the original face images with smooth and natural motion., The Institute of Electronics, Information and Communication Engineers, 16 Feb. 1996, Technical report of IEICE. Multimedia and virtual environment, 95, 524, 35-42, Japanese, 110003270635, AN10476092 - 光線情報による3次元実空間の効率的記述へ向けた光線空間射影法
苗村健; 柳澤健之; 金子正秀; 原島博
2次元画像符号化技術の標準化が進んだ今日、さらに高度な臨場感の実現へ向け、3次元画像通信の研究に寄せられる期待は大きい。将来の3次元画像通信では、様々な表示方式に対応できる中立的な手法による3次元画像の記述が必要である。本稿では、光線情報に着目した3次元画像の中立的記述法として提案されている光線空間の概念に基づき、その効率的記述法について検討する。まず、光線の伝搬に伴う変化がないと仮定することによって、5次元光線空間を4次元に射影して伝送することが可能であることを示す。そして、具体的な射影方法として、平面記録、円筒言己録、球面記録の3通りの方法を定式化し、それぞれの比較を行なう。, 社団法人電子情報通信学会, 01 Feb. 1996, 電子情報通信学会技術研究報告. IE, 画像工学, 95, 503, 49-56, 110003194875 - Natural Representation and Handling of 3-D Objects Using Ray Space
YANAGISAWA Takeyuki; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
Reconstruction of virtual space has become very important in various applications. Computer graphics methods based on geometric models have been studied for this purpose. In order to obtain more natural representation, this paper proposes a method which represents and handles 3-D objects using a concept of "ray space." Handling of objects in the real space is equivalent to getting a sliced image with an appropriate plane in the ray space. The lack of vertical disparity in the ray space, however, causes the problem that the viertical magnification ratio cannot be determined. To solve this problem, we first segment multi-viewed images with disparity information. Then cluster centers of segmented regions are connected to form triangular patches. The vertical magnification ratio is calculated using the smoothed depth information obtained through triangular patches., The Institute of Image Information and Television Engineers, 01 Feb. 1996, ITEJ Technical Report, 20, 4, 57-64, Japanese, 0386-4227, 110003680370, AN00352231 - 動画像の2次元/3次元構造利用符号化に関する検討
上田剛弘; 金子正秀; 斎藤隆弘; 原島博
動画像中の対象物に関する構造化された3次元情報を用いることにより, 動画像に対する記述能力が向し, 符号化効率の改善が図れると共に、映像操作の自由度が大きくなると考えられる。しかしながら, 様々な環境下で撮影された映像から, すべての対象物に対して, 常に安定した3次元情報を抽出することは難しい。このため, 2次元および3次元の構造情報を組合せた符号化手法が有効となる。本稿では, まず3次元情報を扱えるように2次元のレイヤー表現を拡張したセッティング表現について述べる。次に, 複数フレームに対して安定した3次元パラメータを抽出する手法について説明する。最後に, 平面記述を用いて2次元/3次元情報を統合して符号化する手法について検討した結果を述べる。, 社団法人電子情報通信学会, 01 Feb. 1996, 電子情報通信学会技術研究報告. IE, 画像工学, 95, 503, 35-42, 110003194873 - 光線空間を利用した3次元物体の自然な表現とその操作手法
柳澤健之; 苗村健; 金子正秀; 原島博
仮想空間の構築に関して、従来からの幾何モデルベースのCG手法に対して、光線空間を用いた3次元物体の自然な表現と操作手法を提案する。被写体空間の3次元物体像を再構成するためには、光線空間から、観測者の視点の位置で決定される平面上の点を読み出して表示すればよい。3次元物体操作は視点と物体との相対的位置関係を変化させることとして取り扱う。しかし、垂直方向の視差が記録されていない光線空間では、垂直方向の拡大率がわからないという問題がある。これに対しては、推定視差情報を利用した領域分割結果のクラスタ中心を節点とする三角形パッチを生成し、平滑化された奥行き情報を得、垂直方向の拡大率に適用する。, 社団法人電子情報通信学会, 01 Feb. 1996, 電子情報通信学会技術研究報告. IE, 画像工学, 95, 503, 57-64, 110003194876 - Video Coding Method Based on 2-D/3-D Structured Information
UEDA Yoshihiro; KANEKO Masahide; SAITO Takahiro; HARASHIMA Hiroshi
This paper presents a new coding method for representing moving images with planes. We extend the layered representation and propose a new planar representation, called "setting representation, " to handle 3-D motion and 3-D depth information. Next, we introduce a consistent 3-D parameter extraction method which repeatedly applies conventional two frames extraction algorithm to multiple frames. The consistent 3-D structured information. however. cannot always be extracted under various conditions. In order to make good use of the extracted consistent 3-D information, we present a new video coding method based on 2-D/3-D structured information obtained by the integration of the layered and the setting representations., The Institute of Image Information and Television Engineers, 01 Feb. 1996, ITEJ Technical Report, 20, 4, 35-42, Japanese, 0386-4227, 110003680367, AN00352231 - Efficient Projection of Ray Space for a Ray Based Description of 3-D Real World
NAEMURA Takeshi; YANAGISAWA Takeyuki; KANEKO Masahide; HARASHIMA Hiroshi
For the flexible 3-D image communication, the describing method of 3-D images should be neutral for any kind of 3-D displays. For this purpose, a ray based method has been proposed and the information space of rays is named "Ray Space". In this paper, we propose an efficient projecting method of Ray Space in which rays are assumed to go straight on without any variation in the direction of propagation. We illustrate how the Ray Space is projected on a space of fewer dimension. and formulate three projecting methods. Our methods are useful for data compression of Ray Space and 3-D image data., The Institute of Image Information and Television Engineers, 01 Feb. 1996, ITEJ Technical Report, 20, 4, 49-56, Japanese, 0386-4227, 110003680369, AN00352231 - Recent and Current Researches on Very Low Bitrate Video Coding in Japan
KANEKO Masahide
This paper presents a brief overview of Japanese research activities in the field of very low bitrate video coding. Related researches based on a concept of "Intelligent Image Coding" have started in the middle of 1980's. Although this concept has originated from the consideration to a new type of image coding, it can be also applied to other interesting applications such as human interface, psycho1ogy anid so on. On the other hand, in the 1990's, researches on the improvement of waveform coding have been actively carried out until now to realize very low bitrate video coding. Key techniques employed here are improvemenn of motion compensation technique,adoptionl of region segmentation and so on. In addition to the above, this paper proposes new concepts of image coding, which have the possibility to open the new aspects of image coding ; that is, an idea of interactive image coding, integrated 3-D visual communication and so on., The Institute of Electronics, Information and Communication Engineers, 18 Jan. 1996, IEICE technical report. Pattern recognition and understanding, 95, 469, 43-53, English, 110003299583, AN10013232 - Extraction of Structural Image Information in an Image Sequence for Compact Image Representation
CHEONG Cha Keon; AIZAWA Kiyoharu; SAITO Takahiro; KANEKO Masahide; HARASHIMA Hiroshi
This paper addresses a problem of extraction of the structural motion information for compact image representation. In order to extract a meaningful scene structure from image sequence, global motion and region shape of moving objects are taken into consideration. Intraframe segmentation and moving regions are firstly detected with edges and optical flow information respectively. Secondly, moving regions are roughly separated into moving objects based on clustering the orientation and the amplitude of optical flow for each region of the intraframe segmenation. Motion segmentation can finally be obtained by iterated estimatiou of affine motion parameters and region reassignment according to a criteriou using Gauss-Newton estimation algorithm., The Institute of Image Information and Television Engineers, 15 Dec. 1995, ITEJ Technical Report, 19, 73, 55-60, Japanese, 0386-4227, 110003680022, AN00352231 - 動画像の階層構造表現のための構造情報の抽出
鄭且根; 相澤清晴; 斎藤隆弘; 金子正秀; 原島博
動画像の構造情報抽出を行ない、コンパクトな階層構造表現のための手法について記述する。本手法での構造情報の抽出は局所的な動き情報だけでなく、大域的な動きや動物体の領域形状の情報まで取り入れて行なう。このために、まずエッジ情報からフレーム内領域分割を行なって局所的動き情報に基づいた動領域の検出と初期領域を分割する。次に、分割された各初期領域ごとにアフィン動きモデルのパラメータ推定は、Gauss-Newton法の繰り返しアルゴリズムを用いて直接推定する。そして、動きモデルのパラメータに基づいて領域の統合と修正を行ない、動きと形状に適した動物体を抽出する。本手法を用いることによってより正確な動き情報の推定並びに動物体の抽出が可能となる。, 社団法人電子情報通信学会, 15 Dec. 1995, 電子情報通信学会技術研究報告. CS, 通信方式, 95, 436, 55-60, 110003282541 - 推定視差情報を用いた多眼3次元画像の領域分割・統合
苗村健; 柳澤健之; 金子正秀; 原島博
3次元画像技術を駆使した次世代の通信・仮想現実システムの構築に向け、情報通信の立場からの研究が盛んになりつつある。これまで筆者らは、多眼3次元画像を対象に、画像補間や情報圧縮に関する検討を進めてきた。多眼3次元画像を効率的に扱うためには、各視差像間の対応関係を如何に抽出し、記述するかが今後の技術課題となっている。本稿では、この対応関係を被写体の色や形状に適合した領域単位で記述し、物体を切り出す手法について検討する。, 社団法人電子情報通信学会, 05 Sep. 1995, 電子情報通信学会ソサイエティ大会講演論文集, 1995, 110003354127 - Handlimg of 3-Dimensional Objects in Ray Space
YANAGISAWA Takeyuki; NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
近年、さまざまな画像表示技術の進歩、計算機の処理速度の向上に支えられて、Virtual Reality(VR)技術の進歩がめざましい。VR空間の構築にはこれまで主としてCG技術が用いられてきた。一方、実写画像を用いてVR空間を構築しようとすると、奥行き情報の取得という困難な問題が存在する。ここでは、多眼3次元画像から構築される「光線空間」という概念を用いた3次元物体の操作手法について検討する。本手法により、奥行き情報を取得しなくても、3次元物体を操作できるようになる。, The Institute of Electronics, Information and Communication Engineers, 05 Sep. 1995, Proceedings of the Society Conference of IEICE, 1995, 171-171, Japanese, 110003354160, AN10489017 - 動画像の抽象化索引映像の作成
奥宮啓司; 金子正秀; 原島博
近年、動画像符号化の分野においては、従来の波形符号化における単なる情報圧縮ということだけでなく、多様な映像利用に活用できるような符号化技術の研究開発が要望されてきている。本稿では、動画像のセル画的な構造を抽出し、これに基づいて抽象化索引映像、すなわち人間が見たときに主題が理解できる程度の概略画像を生成することを試みる。抽象化索引映像は画像データベースにおける見出し画像に利用できる他、画像を編集、加工、符号化する際の補助画像としての役割など様々な面での応用が可能である。, 社団法人電子情報通信学会, 05 Sep. 1995, 電子情報通信学会ソサイエティ大会講演論文集, 1995, 110003342801 - ブロックの重み付けによる動画像フラクタル符号化
プシカール; 金子正秀; 原島博
Recent publications have demonstrated a new fractallike approach for video image coding as well as a new still image coding method relying on weighted finite automata. In the present paper we prove that K,CulikII's approach gracefully unifying fractal video coding and vector quantization can be extended to a frame per frame video encoding method., 社団法人電子情報通信学会, 05 Sep. 1995, 電子情報通信学会ソサイエティ大会講演論文集, 1995, 110003354093 - 動画像のインタラクティブコマンド符号化
太田善之; 金子正秀; 原島博
超低ビットレートでの画像符号化(VLBV)を実現するためのアプローチの一つとして、画像の構造を抽出し意味内容を理解する手法が有用である。しかし、現在の画像処理技術では、外乱の影響を受けずに同一の画像特徴を自動的かつ安定に抽出することは困難である。一方、画像利用技術においては、画像DBの内容検索や画像理解、CVとCGとの融合など、システムが画像上の意味内容をある程度理解することが必要とされる応用に関して、研究が進められてきている。ここでは、画像の特徴を抽出する技術が共通した要素技術として重要である。特徴抽出技術については高速・高性能であることが望ましいが、例えばマルチメディア環境下での電子メール等の非実時間通信への応用を考えた場合、必ずしも実時間・自動処理は要求されない。以上のような考察から、本稿では従来の「実時間・全自動」という画像符号化パラダイムから一旦離れ、「非実時間・インタラクティブ操作」という前提の下で、画像の意味内容を抽出する符号化方式について検討する。, 社団法人電子情報通信学会, 05 Sep. 1995, 電子情報通信学会ソサイエティ大会講演論文集, 1995, 110003342800 - Headline Representatino of Moving Images using the Significance of Regions
OZAKI Gakuto; KANEKO Masahide; HARASHIMA Hiroshi
For retrieving and handling moving image sequences, it will be convenient for users to provide headline images which represent the significant parts of original image sequence concisely. This paper discusses how to divide image sequence into regions with individual meanings and presents the three possible methods to obtain headline images., The Institute of Image Information and Television Engineers, 26 Jul. 1995, Proceedings of The ITE Annual Convention, 31, 31, 121-122, Japanese, 0919-1879, 110004774349 - Interpolation of 3-D Multiview Images using Two-steps Segmentation and Affine Transformation
Takeuchi Keisuke; Hsu Robert; Kaneko Masahide; Harashima Hiroshi
This paper proposes two-steps segmentation algorithm to interpolate multiview images. In the first step, an image is partitioned into regions by using K-means clustering algorithm. In the second step, each region is further segmented into polygons which are suitable for affine transformation. Segmentation in the second step is performed in two ways ; 1) to detect the vertices of each region and to partition each region into multiple triangles ; and 2) to approximate each region by a rectangle. Using those algorithms, we calculate affine parameters, and interpolate an intermediate image by affine transformation., The Institute of Electronics, Information and Communication Engineers, 19 May 1995, IEICE technical report. Pattern recognition and understanding, 95, 44, 41-48, Japanese, 110003299501, AN10013232 - Editing of Images using the Description of Image Structure
TAKESHITA Hirohide; KANEKO Masahide; HARASHIMA Hiroshi
画像の内容を構造的に記述することにより、内容に立ち入った知的な編集・加工を行うことが可能になる。本稿では、画像を各々意味のあるひとまとまりの領域に分けた上で、各領域の奥行き方向での前後関係を考慮した形で編集を行う方法について検討する。この際、編集操作の便を図るため、領域の識別や操作の記述に関し、言葉との対応付けを考慮する。, The Institute of Electronics, Information and Communication Engineers, 27 Mar. 1995, Proceedings of the IEICE General Conference, 1995, 288-288, Japanese, 110003247837, AN10471452 - ホログラムと光線空間の相互変換
木藤英二; 藤井俊彰; 金子正秀; 原島博
我々の提案している3次元統合画像通信では、入出力方式によらない3次元画像の中間的な記述を目指しており、その中で光線群により3次元画像を統一的に表現するという手法の検討を進めている。本稿では、複素振幅(以下ホログラム)の光線空間への変換について実験的検討を行ったので報告する。, 社団法人電子情報通信学会, 27 Mar. 1995, 電子情報通信学会総合大会講演論文集, 1995, 2, 110003242120 - View Interpolation of a Multi-View 3-D Image Using E Filters
NAEMURA Takeshi; KANEKO Masahide; HARASHIMA Hiroshi
将来の柔軟な三次元情報環境に向けた研究開発が望まれている。多眼三次元画像を構成する各二次元画像を撮影方向順に並べたときの、ある水平1ラインにおける断面(水平軸×視差軸)には、被写体空間を反映した幾何学的構造が現れる。この構造性を利用することにより、多眼三次元画像に対して視差像補間などの処理を行なうことが考えられる。この断面図から直線成分を抽出することは、被写体空間座標をハフパラメータとする空間にハフ変換して、その集積点を抽出することに相当する。本稿では、ε-フィルタを用いることにより、撮影時に視差像毎に生じる対応点輝度のバラツキを吸収し、同時にオクルージョンによる得票差も対応し得る手法について検討を加える。, The Institute of Electronics, Information and Communication Engineers, 27 Mar. 1995, Proceedings of the IEICE General Conference, 1995, 2, 365-365, Japanese, 110003242356, AN10471452 - Automatic Extraction of Facial Features using Two-Step GA Search
NAKAGAWA Masayuki; KANEKO Masahide; HARASHIMA Hiroshi
人物顔画像の3次元モデルを作るためには、目、鼻、口などの顔部品の形状を表す特徴点を抽出する必要がある。しかし、この作業は自動化が難しく、顔画像処理の実用化の妨げとなっている。そこで本研究では、遺伝的アルゴリズムを用いて、顔部品の位置と形状に対して2段階の探索を行なうことにより、顔特徴点を自動抽出する方法を検討する。, The Institute of Electronics, Information and Communication Engineers, 27 Mar. 1995, Proceedings of the IEICE General Conference, 1995, 253-253, Japanese, 110003247765, AN10471452 - マルチメディアメール環境における対話型符号化の基本構成
大関和夫; 斉藤隆弘; 金子正秀; 原島博
画像の高能率符号化の標準化は、その応用上の要請や膨大な画像データ量の問題から実時間、自動処理を前提とした波形符号化が中心であった。これに対して、今後発展が予想される蓄積系メディアあるいはe-mail等の非実時間通信環境では、符号化に際しても必ずしも実時間、自動処理は要請されない。このように符号化の対象を非実時間対話型にまで拡張すれば、従来にない飛躍的な高能率化および高機能化を図れる可能性がある。例えば、e-mailは今後、マルチメディア化が進むと考えられるが、通信コストが増加すれば、network利用のメットがなくなるため、超低ビットレート符号化方式の必要性はきわめて高い。更に、非実時間処理方式では、送信者である人間の意図を編集指示できる環境にある。これらの要素を全て集結させた画像の対話型符号化方式について基本検討を行ったので報告する。, 社団法人電子情報通信学会, 27 Mar. 1995, 電子情報通信学会総合大会講演論文集, 1995, 110003247839 - 三角形パッチ表現による距離画像の情報圧縮
石川彰夫; 苗村健; 鄭文濤; 金子正秀; 原島博
VR技術の発達に伴い、三次元情報を圧縮する技術の確立が必要とされている。ここでは、レンジファインダで測定した円筒座標距離画像(512×256,8bits/pel)を対象とし、その効率的な圧縮方法を検討する。これまで我々は、三次元形状の曲率に着目した記述の検討を進めてきた。本研究では、情報圧縮の立場からの検討を加えた。また、距離画像のSNRだけでなく、三次元形状の復元を行なって、精度の評価を行なった。, 社団法人電子情報通信学会, 27 Mar. 1995, 電子情報通信学会総合大会講演論文集, 1995, 2, 110003241998 - Intelligent communications and humane media
Kaneko Masahide; Harashima Hiroshi
When we discuss communication technologies,we should place humans in the center of discussion.Media technologies can be thought as the means to construct the better communication environment for humans.Since the technologies had not matured until recent days,humans had to adapt to machines.Remarkable development in the related technologies such as computers, telecommunications and so forth has made it possible to discuss communications and media technologies which are friendly to humans. This paper firstly overviews the development in the field of communications.Then we consider intelligent communications,human communication technologies,multimedia and human(e)media.Finally,we describe the concept of "virtual humane city" as the total multimedia system including the social and economic aspects., The Institute of Electronics, Information and Communication Engineers, 14 Oct. 1994, Technical report of IEICE. HC, 94, 275, 1-8, Japanese, 110003285058, AN10211338 - バ-チャルリアリティとマルチメディア情報処理
金子正秀; 原島博
応用物理学会分科会日本光学会, Jul. 1994, 光学, 23, 7, p398-405, Japanese, 0389-6625, 40001175029, AN00080324
Books and other publications
- 顔の百科事典
Dictionary or encycropedia, Japanese, Joint editor, 編集委員 主に 7章 コンピュータと顔 -顔の情報学-, 丸善出版, Sep. 2015, 9784621089583 - 顔の百科事典
金子正秀; 他共著
Dictionary or encycropedia, Japanese, Contributor, 7章 コンピュータと顔-顔の情報学-、9章 似せる顔-似顔絵にみる顔の印象学-, 丸善出版, Sep. 2015, 9784621089583 - 顔を科学する 適応と障害の脳科学
金子正秀; 他分担執筆
Japanese, Joint work, 16章 コンピュータによる顔の印象の分析と合成, 東京大学出版会, Jan. 2013 - 画像電子情報ハンドブック
金子正秀; 他分担執筆
Japanese, Joint work, 第IV編 応用技術編、第1章「セキュリティ」、1.2.3 顔画像による認証, 東京電機大学出版局, Feb. 2008 - 感じる・楽しむ・創りだす 感性情報学 --- 感性的ヒューマンインタフェース最前線
Japanese, Joint work, コラム#02 自然な対話もできる似顔絵エージェント, 工作舎, May 2004 - Image Processing Technologies: Algorithms, Sensors and Applications
Masahide Kaneko; Osamu Hasegawa; Takeshi Naemura
English, Joint work, Marcel Dekker, Inc., Apr. 2004 - コンピュータ画像処理
金子正秀; 他共著
Japanese, Joint work, オーム社, Dec. 2002 - 電子情報通信学会編:改訂 電子情報通信用語辞典
金子正秀; 他分担執筆
Japanese, Joint work, コロナ社, Jul. 1999 - 映像情報メディア用語辞典
金子正秀; 他分担執筆
Japanese, Joint work, 映像情報メディア学会編,コロナ社, Jan. 1999 - 電子情報通信用語辞典
金子正秀; 他分担執筆
Japanese, Joint work, コロナ社, 1999 - 映像情報メディア用語辞典
金子正秀; 他分担執筆
Japanese, Joint work, コロナ社, 1999 - テレビジョン画像情報工学ハンドブック
金子正秀; 他分担執筆
Japanese, Joint work, オーム社, 1990 - 画像処理ハンドブック
金子正秀; 他分担執筆
Japanese, Joint work, 昭晃堂, 1987 - コンピュータ画像処理入門
金子正秀; 他分担執筆
Japanese, Joint work, 総研出版, 1985
Lectures, oral presentations, etc.
- 介護老人福祉施設における介護ロボット・機器の導入に関する研究
壬生尚美; 森千佐子; 永嶋昌樹; 鶴岡浩樹; 竹内幸子; 山口育子; 金子正秀
Oral presentation, Japanese, 第19回人間福祉学会大会, 人間福祉学会, 中部学院大学 関キャンパス(岐阜県関市), Domestic conference
Nov. 2018 - Coupled GP-HSMMを用いた連続動作の分節化に基づくインタラクションのモデル化
押川慧; 中村友昭; 長井隆行; 岩橋直人; 船越孝太郎; 中野幹生; 金子正秀
Oral presentation, Japanese, 2018年度人工知能学会全国大会(第32回), 人工知能学会, 鹿児島市(城山観光ホテル), Domestic conference
08 Jun. 2018 - ノンパラメトリックベイズ法に基づく時系列データの分節化
長野匡隼; 中村友昭; 長井隆行; 持橋大地; 小林一郎; 金子正秀
Oral presentation, Japanese, 2018年度人工知能学会全国大会(第32回), 人工知能学会, 鹿児島市(城山観光ホテル), Domestic conference
06 Jun. 2018 - 時系列マルチモーダル情報の分節・分類に基づく物体と動作の統合概念学習
布川遼太郎; 宮澤和貴; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, 2018年度人工知能学会全国大会(第32回), 人工知能学会, 鹿児島市(城山観光ホテル), Domestic conference
05 Jun. 2018 - 階層ディリクレ過程による動作クラス数推定を導入したGP-HSMMによる連続動作からの基本動作抽出
長野匡隼; 中村友昭; 長井隆行; 持橋大地; 小林一郎; 金子正秀
Oral presentation, Japanese, 情報処理学会第80回全国大会, 情報処理学会, 早稲田大学西早稲田キャンパス(東京都新宿区大久保), Domestic conference
15 Mar. 2018 - 時系列マルチモーダル情報の分節・分類に基づくロボットによる概念の学習
布川遼太郎; 宮澤和貴; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, 情報処理学会第80回全国大会, 情報処理学会, 早稲田大学西早稲田キャンパス(東京都新宿区大久保), Domestic conference
14 Mar. 2018 - 概念・言語獲得モデルに対する構成論的解析 -概念形成過程における育児語の影響-
船田美雪; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, 情報処理学会第80回全国大会, 情報処理学会, 早稲田大学西早稲田キャンパス(東京都新宿区大久保), Domestic conference
14 Mar. 2018 - 分節化による行動の抽出とその相互関係の推定に基づくインタラクションのモデル化
押川慧; 中村友昭; 長井隆行; 船越孝太郎; 岩橋直人; 中野幹生; 金子正秀
Oral presentation, Japanese, 情報処理学会第80回全国大会, 情報処理学会, 早稲田大学西早稲田キャンパス(東京都新宿区大久保), Domestic conference
14 Mar. 2018 - 似顔絵生成を目的とした鼻・目輪郭情報の抽出および適応的描画
坂本裕貴; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, 関東学院大学関内メディアセンター(横浜市), Domestic conference
24 Feb. 2018 - 混雑状況におけるローカル情報を用いた時空間RRTによる自律移動ロボットの動的経路生成
中村和樹; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, 関東学院大学関内メディアセンター(横浜市), Domestic conference
24 Feb. 2018 - 顔形状とテクスチャ変化に表れる男性の加齢印象の画像解析に基づく定量的評価
海老沢賢汰; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, 関東学院大学関内メディアセンター(横浜市), Domestic conference
24 Feb. 2018 - 顔形状とテクスチャ変化に表れる男性の加齢印象の定量的評価
海老沢賢汰; 中村友昭; 金子正秀
Oral presentation, Japanese, 2017映像情報メディア学会冬季大会, 映像情報メディア学会, 早稲田大学 西早稲田キャンパス(東京都新宿区大久保3-4-1), Domestic conference
13 Dec. 2017 - 似顔絵生成を目的とした顔画像からの鼻筋・小鼻・鼻孔形状の自動抽出
坂本裕貴; 中村友昭; 金子正秀
Oral presentation, Japanese, 2017映像情報メディア学会冬季大会, 映像情報メディア学会, 早稲田大学 西早稲田キャンパス(東京都新宿区大久保3-4-1), Domestic conference
13 Dec. 2017 - ローカル情報を用いた時空間RRTによる自律移動ロボットの動的経路生成
中村和樹; 中村友昭; 金子正秀
Poster presentation, Japanese, 第60回自動制御連合講演会, 計測自動制御学会他, 電気通信大学, 東京都調布市, Domestic conference
10 Nov. 2017 - An agent-based pedestrian flow simulation in a simple building hall
Victor Daniel; Tejeda Mejia; IPN, Mexico; Masahide Kaneko
Oral presentation, English, La-CEP FY2017 Closing Ceremony, 電気通信大学, 東京都調布市, Domestic conference
27 Sep. 2017 - HDP-GP-HSMMに基づく身体動作の分節化
長野匡隼; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, 第35回日本ロボット学会学術講演会(RSJ2017), 日本ロボット学会, 東洋大学 川越キャンパス(埼玉県川越市), Domestic conference
14 Sep. 2017 - 平均髪を用いた髪画素値の推定に基づく顔画像からの髪領域抽出
十重田大地; 中村友昭; 金子正秀
Poster presentation, Japanese, 第22回日本顔学会大会(フォーラム顔学2017), 日本顔学会, 関西学院大学(西宮上ケ原キャンパス)(兵庫県西宮市上ケ原一番町1-155), Domestic conference
09 Sep. 2017 - コンピュータ似顔絵師6 ~似顔絵の自動生成、豊かな表現を添えて~(実演デモ)
坂本裕貴; 十重田大地; 金子正秀
Others, Japanese, 第22回日本顔学会大会(フォーラム顔学2017), 日本顔学会, 関西学院大学(西宮上ケ原キャンパス)(兵庫県西宮市上ケ原一番町1-155), Domestic conference
09 Sep. 2017 - 男性の加齢に伴う印象変化と要因解析
橋本公男; 山口あゆみ; 蒔田愛; 松原薫; 金子正秀
Oral presentation, Japanese, 第22回日本顔学会大会(フォーラム顔学2017), 日本顔学会, 関西学院大学(西宮上ケ原キャンパス)(兵庫県西宮市上ケ原一番町1-155), Domestic conference
09 Sep. 2017 - Analysis of the six basic facial expressions from a cross-cultural database using hybrid features and unsupervised learning
David Allan Jones; Gibran Benitez-Garcia; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.38 -, 電気通信大学, 電気通信大学(東京都調布市), Domestic conference
07 Aug. 2017 - 複数概念の時間的分節化に基づくロボットによる上位概念の学習
中村友昭; 宮澤和貴; 青木達哉; 長井隆行; 金子正秀
Oral presentation, Japanese, 2017年度人工知能学会全国大会(第31回)(JSAI2017), 人工知能学会, ウインクあいち(愛知県名古屋市), Domestic conference
26 May 2017 - 人のインタラクションからの教師なしルール学習
押川慧; 中村友昭; 長井隆行; 岩橋直人; 船越孝太郎; 金子正秀
Oral presentation, Japanese, 2017年度人工知能学会全国大会(第31回)(JSAI2017), 人工知能学会, ウインクあいち(愛知県名古屋市), Domestic conference
26 May 2017 - HDP-HMMとLDAに基づく保育園児の行動軌跡からの教師なし活動場面分類
池田佳那; 張斌; 中村友昭; 長井隆行; 大森隆司; 岡夏樹; 金子正秀
Oral presentation, Japanese, 2017年度人工知能学会全国大会(第31回)(JSAI2017), 人工知能学会, ウインクあいち(愛知県名古屋市), Domestic conference
25 May 2017 - MLDAと教師なし単語分割に基づく概念と言語の相互学習 - 育児語が概念形成に与える影響の解析 -
船田美雪; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, 2017年度人工知能学会全国大会(第31回)(JSAI2017), 人工知能学会, ウインクあいち(愛知県名古屋市), Domestic conference
25 May 2017 - マルチモーダル情報を利用した家庭用ロボットのためのロバストな音声命令理解
小堀嵩博; 中村友昭; 長井隆行; 岩橋直人; 船越孝太郎; 金子正秀
Oral presentation, Japanese, 情報処理学会第79回全国大会, 情報処理学会, 名古屋大学東山キャンパス(名古屋市千種区), Domestic conference
18 Mar. 2017 - 概念と言語の相互学習における育児語の影響の解析
船田美雪; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, 情報処理学会第79回全国大会, 情報処理学会, 名古屋大学東山キャンパス(名古屋市千種区), Domestic conference
17 Mar. 2017 - 自律案内ロボットにおけるユーザグループの認識と追跡を同時に行うシステム
張斌; 中村友昭; 金子正秀
Oral presentation, Japanese, 情報処理学会第79回全国大会, 情報処理学会, 名古屋大学東山キャンパス(名古屋市千種区), Domestic conference
16 Mar. 2017 - Analysis of basic facial expressions from a cross-cultural database using hybrid features and unsupervised learning
David Allan Jones; Gibran Benitez-Garcia; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.37 -, 電気通信大学, 電気通信大学(東京都調布市), Domestic conference
07 Mar. 2017 - Facial features analysis across age progression
Dario Ivan; Rosas Miranda; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.37 -, 電気通信大学, 電気通信大学(東京都調布市), Domestic conference
06 Mar. 2017 - 小型ドローンに対する3次元パーソナルスペース
芝田伊吹; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会メディア工学研究会, 映像情報メディア学会, 関東学院大学関内メディアセンター(横浜市), Domestic conference
18 Feb. 2017 - 顔画像からの歯及び口腔領域を含んだ口領域の自動抽出 ~ 畳み込みニューラルネットワークによる画素別領域推定の利用 ~
平林謙太郎; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会メディア工学研究会, 映像情報メディア学会, 関東学院大学関内メディアセンター(横浜市), Domestic conference
18 Feb. 2017 - CNNによる画素別推定を利用した顔画像からの口領域の自動抽出
平林謙太郎; 中村友昭; 金子正秀
Oral presentation, Japanese, 2016年映像情報メディア学会冬季大会, 映像情報メディア学会, 東京理科大学 森戸記念館(東京都新宿区), Domestic conference
21 Dec. 2016 - Appearance- and Geometric-based Methodical Feature Analysis of Facial Parts using PCA for Facial Expression Recognition
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
Oral presentation, English, Vision Engineering Workshop 2016 (ViEW2016), 精密工学会 画像応用技術専門委員会, パシフィコ横浜アネックスホール(横浜市西区), Domestic conference
08 Dec. 2016 - 保育園児および保育士の行動軌跡の教師なし分類に基づく活動識別
池田佳那; 張斌; 中村友昭; 長井隆行; 大森隆司; 岡夏樹; 金子正秀
Oral presentation, Japanese, SSI2016(計測自動制御学会 システム・情報部門 学術講演会2016), 計測自動制御学会 システム・情報部門, 滋賀県立体育館(滋賀県大津市), Domestic conference
06 Dec. 2016 - MLDAと教示なし単語分割に基づく概念と言語モデルの学習過程の解析
船田美雪; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, SSI2016(計測自動制御学会 システム・情報部門 学術講演会2016), 計測自動制御学会 システム・情報部門, 滋賀県立体育館(滋賀県大津市), Domestic conference
06 Dec. 2016 - 保育支援のための子ども行動追跡システムへの評価
張斌; 中村友昭; 潮木玲奈; 長井隆行; 阿部香澄; 大森隆司; 岡夏樹; 金子正秀
Oral presentation, Japanese, SSI2016(計測自動制御学会 システム・情報部門 学術講演会2016), 計測自動制御学会 システム・情報部門, 滋賀県立体育館(滋賀県大津市), Domestic conference
06 Dec. 2016 - 鼻孔・小鼻の特徴点自動抽出の精度向上および似顔絵生成システムへの反映
坂本裕貴; 中村友昭; 金子正秀
Poster presentation, Japanese, 第21回日本顔学会大会、フォーラム顔学2016, 日本顔学会, 東京藝術大学美術学部(東京都台東区上野公園), Domestic conference
20 Nov. 2016 - Analysis of the Effect of Static Structure of Faces for Facial Expression Recognition
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
Poster presentation, English, 第21回日本顔学会大会、フォーラム顔学2016, 日本顔学会, 東京藝術大学美術学部(東京都台東区上野公園), Domestic conference
20 Nov. 2016 - コンピュータ似顔絵師5 ~ 表現力豊かな似顔絵の自動生成 ~ (実演デモ)
平林謙太郎; 坂本裕貴; 金子正秀
Oral presentation, Japanese, 第21回日本顔学会大会、フォーラム顔学2016, 日本顔学会, 東京藝術大学美術学部(東京都台東区上野公園), Domestic conference
19 Nov. 2016 - Geometric-based feature analysis of differences between western and east-asian expressive faces based on principal component scores
Gibran Benitez-Garcia; Tomoaki Nakamura; Masahide Kaneko
Oral presentation, English, ヒューマンインタフェースシンポジウム2016(HIS2016), ヒューマンインタフェース学会, 東京農工大学, 小金井キャンパス(東京都小金井市), Domestic conference
07 Sep. 2016 - Facial features analysis across age progression
Dario Ivan; Rosas Miranda; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.36 -, 電気通信大学, 東京都調布市, Domestic conference
09 Aug. 2016 - Robust human identification under arbitrary postures
Mariana Rodrigues Makiuchi; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.36 -, 電気通信大学, 東京都調布市, Domestic conference
08 Aug. 2016 - Categorical vs dimensional theory for facial expression Recognition Evaluation
Liang Shan; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.36 -, 電気通信大学, 東京都調布市, Domestic conference
08 Aug. 2016 - Robust 2D mapping for mobile robot containing 3D information
Adisorn Yimsuk; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.36 -, 電気通信大学, 東京都調布市, Domestic conference
08 Aug. 2016 - 複数のKinectを用いた子どもの行動追跡及び個人認証
張斌; 中村友昭; 阿部香澄; アッタミミムハンマド; 長井隆行; 大森隆司; 岡夏樹; 金子正秀
Oral presentation, Japanese, 2016年度人工知能学会全国大会, 人工知能学会, 福岡県北九州市(小倉) 西日本総合展示場AIM(アジア太平洋インポートマート), Domestic conference
09 Jun. 2016 - 環境情報を考慮したロボットによる音声命令理解
小堀嵩博; 中村友昭; 長井隆行; 岩橋直人; 船越孝太郎; 中野幹生; 金子正秀
Oral presentation, Japanese, 2016年度人工知能学会全国大会, 人工知能学会, 福岡県北九州市(小倉) 西日本総合展示場AIM(アジア太平洋インポートマート), Domestic conference
06 Jun. 2016 - ガウス過程の隠れセミマルコフモデルに基づく身体動作の分節化
中村友昭; Attamimi Muhammad; 長井隆行; 持橋大地; 小林一郎; 麻生英樹; 金子正秀
Oral presentation, Japanese, 2016年度人工知能学会全国大会, 人工知能学会, 福岡県北九州市(小倉) 西日本総合展示場AIM(アジア太平洋インポートマート), Domestic conference
06 Jun. 2016 - Categorical vs dimensional theory for facial expression recognition evaluation
Liang Shan; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.35 -, 電気通信大学, 東京都調布市, Domestic conference
04 Mar. 2016 - Robust 2D mapping for mobile robot containing 3D information
Adisorn Yimsuk; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.35 -, 電気通信大学, 東京都調布市, Domestic conference
04 Mar. 2016 - 動的障害物の移動量の曖昧性を考慮した時空間RRTによる自律移動ロボットの経路生成
黒坂 翼; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, メディア工学研究会, 関内, 横浜(関東学院大学関内メディアセンタ), Domestic conference
20 Feb. 2016 - 似顔絵画家の描画スタイル及び誇張方法に倣ったコンピュータ似顔絵手法
林 晃平; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, メディア工学研究会, 関内, 横浜 (関東学院大学関内メディアセンタ), Domestic conference
20 Feb. 2016 - 動的環境下において同伴者との位置関係を調節しながら同行を維持する自律移動ロボット
綿貫貴文; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, メディア工学研究会, 関内, 横浜(関東学院大学関内メディアセンタ), Domestic conference
20 Feb. 2016 - 似顔絵生成システムにおける鼻孔および小鼻の自動抽出
坂本裕貴; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, メディア工学研究会, 関内, 横浜(関東学院大学関内メディアセンタ), Domestic conference
20 Feb. 2016 - マルチモーダルLDAに基づく概念学習における概念と言語の相互作用の解析
船田美雪; 中村友昭; 長井隆行; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, メディア工学研究会, 関内, 横浜(関東学院大学関内メディアセンタ), Domestic conference
20 Feb. 2016 - 保育支援システムのためのKinect を用いた子どもの行動追跡
張斌; 中村友昭; 阿部香澄; アッタミミムハンマド; 潮木玲奈; 長井隆行; 大森隆司; 岡夏樹; 金子正秀
Oral presentation, Japanese, SSI2015 計測自動制御学会 システム・情報部門 学術講演会 2015, 計測自動制御学会 システム・情報部門, 北海道函館市 函館アリーナ, Domestic conference
20 Nov. 2015 - ガウス過程の隠れマルコフモデルによる時系列データ分節化
中村友昭; アッタミミムハンマド; 長井隆行; 持橋大地; 小林一郎; 麻生英樹; 金子正秀
Oral presentation, Japanese, SSI2015 計測自動制御学会 システム・情報部門 学術講演会 2015, 計測自動制御学会 システム・情報部門, 北海道函館市 函館アリーナ, Domestic conference
20 Nov. 2015 - マルチモーダル情報を利用したロボットによるロバストな命令理解
小堀嵩博; 中村友昭; 長井隆行; 岩橋直人; 船越孝太郎; 中野幹夫; 金子正秀
Oral presentation, Japanese, SSI2015 計測自動制御学会 システム・情報部門 学術講演会 2015, 計測自動制御学会 システム・情報部門, 北海道函館市 函館アリーナ, Domestic conference
20 Nov. 2015 - A considerate guidance framework of servicing a users' group for autonomous guiding robot
Bin Zhang; Tomoaki Nakamura; Masahide Kaneko
Oral presentation, English, 電子情報通信学会クラウドネットワークロボット研究会(CNR), 電子情報通信学会, やまと会議室(奈良市), Domestic conference
30 Oct. 2015 - 顔特徴点の自動抽出における撮影条件の緩和 ~ 髪の毛、眉、顔輪郭の頑健な抽出 ~
平林謙太郎; 山屋貴尚; 中村友昭; 金子正秀
Poster presentation, Japanese, 2015年日本顔学会大会(フォーラム顔学2015), 日本顔学会, 中京大学八事キャンパス(名古屋市昭和区), Domestic conference
13 Sep. 2015 - コンピュータ似顔絵師4 ~ コンピュータによる似顔絵の表現力向上 ~(実演デモ)
林晃平; 平林謙太郎; 金子正秀
Others, Japanese, 2015年日本顔学会大会(フォーラム顔学2015), 日本顔学会, 中京大学八事キャンパス(名古屋市昭和区), Domestic conference
12 Sep. 2015 - 物体情報と言語情報を統合したロボットによる命令理解
小堀嵩博; 中村友昭; 長井隆行; 岩橋直人; 船越孝太郎; 中野幹生; 金子正秀
Oral presentation, Japanese, 第33回日本ロボット学会学術講演会, 日本ロボット学会, 東京電機大学 東京千住キャンパス(東京都足立区), Domestic conference
05 Sep. 2015 - Autonomous mobile robot that can meet target person at specific location under cluttered environment
Ivan Alejandro Velasco Rosas; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.34 -, 電気通信大学, 東京都調布市, Domestic conference
05 Aug. 2015 - 行動識別,スロット抽出および音声認識の統合によるノイズに頑健な命令理解
小堀嵩博; 中村友昭; 長井隆行; 岩橋直人; 中野幹生; 船越孝太郎; 金子正秀
Oral presentation, Japanese, 2015年度人工知能学会全国大会(第29回), 人工知能学会, 公立はこだて未来大学(函館市), Domestic conference
31 May 2015 - SVMとCRFを用いたロボットによるロバストな命令理解
小堀崇博; 中村友昭; 長井隆行; 中野幹生; 船越孝太郎; 金子正秀
Oral presentation, Japanese, 情報処理学会第77回全国大会, 情報処理学会第77回全国大会, 京都大学 吉田キャンパス(京都市), Domestic conference
19 Mar. 2015 - Tracking Method of Multiple Users Group in a Crowd for Autonomous Guiding Robot
Bin Zhang; Tomoaki Nakamura; Masahide Kaneko
Oral presentation, English, 情報処理学会第77回全国大会, 情報処理学会第77回全国大会, 京都大学 吉田キャンパス(京都市), Domestic conference
18 Mar. 2015 - Robust recognition of multiple particular users’ group for autonomous guiding robot
Bin Zhang; Tomoaki Nakamura; Masahide Kaneko
Oral presentation, English, 電子情報通信学会2015年総合大会, 電子情報通信学会2015年総合大会, 立命館大学(滋賀県草津市), Domestic conference
11 Mar. 2015 - Autonomous robot that can meet target person at expected location under cluttered environment
Ivan Alejandro Velasco Rosas; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.33 -, 電気通信大学, 東京都調布市, Domestic conference
06 Mar. 2015 - Quantitative feature analysis of facial expressions based on PCA of shapes and arrangement of facial parts
Elizabeth Garcia Rios; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.33 -, 電気通信大学, 東京都調布市, Domestic conference
05 Mar. 2015 - 台詞に含まれる感情表現を反映したロボット動作の自動生成
宮崎斉; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会技術報告, メディア工学研究会, 関内, 横浜(関東学院大学関内メディアセンタ), Domestic conference
28 Feb. 2015 - 顔部品の形状特徴や顔画像の提示方法の違いが顔の類似判断に与える影響
パン ジュン フイ; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告、メディア工学研究会, 映像情報メディア学会技術報告、メディア工学研究会, 関内、横浜(関東学院大学関内メディアセンタ), Domestic conference
28 Feb. 2015 - 似顔絵自動生成システムにおける顔特徴点の誤抽出判定 ~ 主成分分析手法の利用 ~
高寧; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告、メディア工学研究会, 映像情報メディア学会技術報告、メディア工学研究会, 関内、横浜(関東学院大学関内メディアセンタ), Domestic conference
28 Feb. 2015 - 平林謙太郎、中村友昭、金子正秀:“似顔絵の自動生成における撮影条件の制限の緩和 ~ 髪の毛、眉の安定した抽出に向けて ~
平林謙太郎; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告、メディア工学研究会, 映像情報メディア学会技術報告、メディア工学研究会, 関内、横浜(関東学院大学関内メディアセンタ), Domestic conference
28 Feb. 2015 - 台詞から想起される感情を表現するロボット動作の作成
宮崎斉; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会2014年冬季大会, 映像情報メディア学会2014年冬季大会, 東京理科大学森戸記念館(東京都新宿区神楽坂), Domestic conference
18 Dec. 2014 - 顔部品の形状特徴が顔全体の類似印象に与える影響の評価
パンジュンフイ; 中村友昭; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会2014年冬季大会, 映像情報メディア学会2014年冬季大会, 東京理科大学森戸記念館(東京都新宿区神楽坂), Domestic conference
18 Dec. 2014 - CRFとSVMを用いた家庭用ロボットのための命令理解
中村友昭; 小堀嵩博; 西原成; 長井隆行; 金子正秀
Oral presentation, Japanese, 日本ロボット学会、第1回インテリジェントホームロボティクス研究会, 日本ロボット学会、第1回インテリジェントホームロボティクス研究会, 東京、神田, Domestic conference
07 Dec. 2014 - コンピュータ似顔絵師3 ~ コンピュータによる表情似顔絵の自動描画デモ ~
高寧; パンジュンフイ; 林晃平; 金子正秀
Oral presentation, Japanese, 第19回日本顔学会大会(フォーラム顔学2014), 日本顔学会, 東京都品川区旗の台、昭和大学旗の台キャンパス, Domestic conference
25 Oct. 2014 - Robust tracking of multiple particular users for group guiding robot
Bin Zhang; Tomoaki Nakamura; Masahide Kaneko
Oral presentation, English, 第32回日本ロボット学会学術講演会, 日本ロボット学会, 福岡県福岡市、九州産業大学, Domestic conference
06 Sep. 2014 - SVMとCRFに基づくロボットによる自然言語理解
中村友昭; 小堀嵩博; 長井隆行; 中野幹生; 船越孝太郎; 金子正秀
Oral presentation, Japanese, 第32回日本ロボット学会学術講演会, 日本ロボット学会, 福岡県福岡市、九州産業大学, Domestic conference
06 Sep. 2014 - Quantitative feature analysis of facial expressions based on PCA of shapes and arrangement of facial parts
Elizabeth Garcia Rios; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.32 -, 電気通信大学, 東京都調布市、電気通信大学, Domestic conference
08 Aug. 2014 - Improvement of people tracking algorithm for mapping application using double-layered laser range finder system
Oscar Mario Rosas Tabera; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.32 -, 電気通信大学, 東京都調布市、電気通信大学, Domestic conference
07 Aug. 2014 - Robot navigation based on potential field through Kinect
Deng Qilin; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.32 -, 電気通信大学, 東京都調布市、電気通信大学, Domestic conference
07 Aug. 2014 - 自律移動ロボットにおける手つなぎポテンシャルを用いた並走・縦走制御
綿貫貴文; 金子正秀
Oral presentation, Japanese, 情報処理学会第76回全国大会, 情報処理学会, 東京電機大学(東京都足立区), Domestic conference
11 Mar. 2014 - センサの死角を考慮して安全な移動経路選択を行う自律移動ロボット
黒坂翼; 金子正秀
Oral presentation, Japanese, 情報処理学会第76回全国大会, 情報処理学会, 東京電機大学(東京都足立区), Domestic conference
11 Mar. 2014 - People tracking using a laser range finder on a mobile robot
Oscar Mario Rosas Tabera; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.31 -, 電気通信大学(東京都調布市), Domestic conference
05 Mar. 2014 - Robot navigation based on potential field through Kinect
Deng Qilin; Masahide Kaneko
Poster presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.31 -, 電気通信大学、東京都調布市, Domestic conference
05 Mar. 2014 - 個人差及び撮影条件による変動に頑健な顔特徴の自動抽出手法
杉山公治; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, 関内, 横浜, Domestic conference
22 Feb. 2014 - 言葉により記述される3次元顔特徴の主成分操作による表現
嶋影直城; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, 関内, 横浜, Domestic conference
22 Feb. 2014 - センサの死角を考慮した安全な速度制御によって最適移動経路選択を行う自律移動ロボット
黒坂翼; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, 関内, 横浜, Domestic conference
22 Feb. 2014 - 人に同行する自律移動ロボットにおける手つなぎポテンシャルを用いた移動制御
綿貫貴文; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学研究会, 映像情報メディア学会, 関内, 横浜, Domestic conference
22 Feb. 2014 - コンピュータによる似顔絵の自動生成~顔特徴・印象の対話的操作~
嶋影直城; 杉山公治; 金子正秀
Public symposium, Japanese, 映像メディア処理シンポジウム2013(IMPS2013), 電子情報通信学会画像工学研究専門委員会, 熱海
Nov. 2013 - 顔の拘りを抱く人のアバターの特徴
寺嶋縁里; 佐野奈都貴; 亀田剛; 金子正秀; 寺田員人
Oral presentation, Japanese, 第18回日本顔学会大会(フォーラム顔学2013)
Nov. 2013 - 明度と彩度に対する可変閾値設定による髪の毛領域の自動抽出 ~黒、白、茶、胡麻塩など多様な髪色への対応~
杉山公治; 金子正秀
Oral presentation, Japanese, 第18回日本顔学会大会(フォーラム顔学2013)
Nov. 2013 - 主成分分析を利用した3次元顔特徴の解析 ~ 言葉による顔特徴操作に向けて ~
嶋影直城; 金子正秀
Oral presentation, Japanese, 第18回日本顔学会大会(フォーラム顔学2013)
Nov. 2013 - コンピュータ似顔絵師2 ~ より精度良く、より表情豊かに ~
嶋影直城; 杉山公治; 金子正秀
Oral presentation, Japanese, 第18回日本顔学会大会(フォーラム顔学2013)
Nov. 2013 - 顔が担う情報の系統的取扱い ~ 形状情報から表情・印象等の感性情報まで ~
Invited oral presentation, Japanese, 生命ソフトウェアシンポジウム2013, 日本感性工学会生命ソフトウェア部会
Oct. 2013 - Efficient Human-robot Interaction for Searching Unknown User under Complex Environment with Multiple People and Objects
張斌; 金子正秀
Public symposium, English, 生命ソフトウェアシンポジウム2013, 日本感性工学会生命ソフトウェア部会, 習志野市
Oct. 2013 - Efficient search for receiver based on audiovisual information under complex environment - Toward an intelligent delivery robot -
張斌; 金子正秀
Oral presentation, English, 2013年映像情報メディア学会年次大会,2013年映像情報メディア学会年次大会
Aug. 2013 - Key point based style recognition and intelligent fashion clothing recommendation system
Qingqing Tu; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.30 -
Aug. 2013 - 効率的なインタラクションを用いた複雑環境下でのユーザ探索
張斌; 高橋桂太; 金子正秀
Oral presentation, Japanese, 日本機械学会ロボティクス・メカトロニクス講演会2013(ROBOMEC2013),ロボティクス・メカトロニクス講演会2013(ROBOMEC2013)
May 2013 - 聴衆との双方向でのインタラクション機能を備えたプレゼンテーションロボット
衛広聞; 高橋桂太; 金子正秀
Oral presentation, Japanese, 電子情報通信学会2013年総合大会講演論文集,電子情報通信学会2013年総合大会講演論文集
Mar. 2013 - 車のフロントフェース画像の特徴分析及び表情印象分析
彭璇; 高橋桂太; 金子正秀
Oral presentation, Japanese, 電子情報通信学会2013年総合大会講演論文集,電子情報通信学会2013年総合大会講演論文集
Mar. 2013 - Recognition of change of weak facial expressions
Anderson Arias Marin; Keita Takahashi; Masahide Kaneko
Oral presentation, English, 電子情報通信学会2013年総合大会講演論文集,電子情報通信学会2013年総合大会講演論文集
Mar. 2013 - 主成分分析を用いた3次元表情顔の解析 - 3次元キャラクタへの表情付けの効率化に向けて -
原悠一郎; 高橋桂太; 酒澤茂之; 金子正秀
Oral presentation, Japanese, 平成24年度電子情報通信学会東京支部学生会研究発表会(第18回),平成24年度電子情報通信学会東京支部学生会研究発表会(第18回)
Mar. 2013 - Recognition of ambiguous facial expressions based on decision tree votes
Anderson Arias Marin; Keita Takahashi; Masahide Kaneko
Oral presentation, English, 平成24年度電子情報通信学会東京支部学生会研究発表会(第18回),平成24年度電子情報通信学会東京支部学生会研究発表会(第18回)
Mar. 2013 - Facial expression recognition under partial occlusion based on modal value approach
Gibran Benitez Garcia; Gabriel Sanchez-Perez; Hector Perez-Meana; Keita Takahashi; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.29 -
Mar. 2013 - Intelligent personalized fashion recommendation system
Qingqing Tu; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Informatics & Engineering and Information Systems - No.29 -
Mar. 2013 - センサの死角を考慮した速度制御を用いたロボットの移動経路の策定
冨田脩平; 高橋桂太; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2013 - ユーザと手をつないで行動する「思いやりのある」案内ロボット
宮崎斉; 高橋桂太; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2013 - 聴衆との双方向でのインタラクション機能を備えたプレゼンテーションロボット
衛広聞; 高橋桂太; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2013 - 動的環境に適応したポテンシャル場の生成に基づく並走・縦走ロボットの移動制御
中澤和至; 高橋桂太; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2013 - Facial expression recognition under partial occlusion based on facial region segmentation
Gibran Benitez Garcia; Gabriel Sanchez-Perez; Hector Perez-Meana; Keita Takahashi; Masahide Kaneko
Oral presentation, English, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2013 - 異なるカテゴリーの顔間の特徴・印象の定量的分析に基づく顔認知要因の解明
Oral presentation, Japanese, 科学研究費補助金、新学術領域研究「学際的研究による顔認知メカニズムの解明」2012年度冬の班会議(最終班会議),科学研究費補助金、新学術領域研究「学際的研究による顔認知メカニズムの解明」2012年度冬の班会議(最終班会議)
Jan. 2013 - Comparison of facial expression recognition rates depending on combination of different facial regions
Gibran Benitez Garcia; Gabriel Sanchez-Perez; Hector Perez-Meana; Keita Takahashi; Masahide Kaneko
Oral presentation, English, 2012年映像情報メディア学会冬季大会,2012年映像情報メディア学会冬季大会
Dec. 2012 - 車のフロントフェース画像の特徴解析及び類似車検索
彭璇; 高橋桂太; 金子正秀
Oral presentation, Japanese, 2012年映像情報メディア学会冬季大会,2012年映像情報メディア学会冬季大会
Dec. 2012 - 可変ポテンシャル場により同行者との並走・縦走の動的切り替えが可能な自律移動ロボット
中澤和至; 高橋桂太; 金子正秀
Oral presentation, Japanese, 2012年映像情報メディア学会冬季大会,2012年映像情報メディア学会冬季大会
Dec. 2012 - 顔特徴の自動抽出における髪の毛及び眉の抽出精度の向上
杉山公治; 高橋桂太; 金子正秀
Oral presentation, Japanese, 第17回日本顔学会大会(フォーラム顔学2012),第17回日本顔学会大会(フォーラム顔学2012)
Oct. 2012 - 顔特徴解析を目的とした3次元顔特徴点の自動抽出 ~3次元似顔絵生成を目指して~
嶋影直城; 高橋桂太; 金子正秀
Oral presentation, Japanese, 第17回日本顔学会大会(フォーラム顔学2012),第17回日本顔学会大会(フォーラム顔学2012)
Oct. 2012 - 車のフロントフェースにおける形状・配置の分析と特徴強調
彭璇; 高橋桂太; 金子正秀
Oral presentation, Japanese, 第17回日本顔学会大会(フォーラム顔学2012),第17回日本顔学会大会(フォーラム顔学2012)
Oct. 2012 - コンピュータ似顔絵師
彭璇; 嶋影直城; 杉山公治; 高橋桂太; 金子正秀
Oral presentation, Japanese, 第17回日本顔学会大会(フォーラム顔学2012),第17回日本顔学会大会(フォーラム顔学2012)
Oct. 2012 - 自由視点映像生成のための自然特徴点を用いた多眼カメラの自己位置推定法
高橋桂太; 金子正秀
Public symposium, Japanese, 映像メディア処理シンポジウム (IMPS2012), 電子情報通信学会映像メディア処理シンポジウム (IMPS2012), 静岡県熱海市
Oct. 2012 - 似顔絵とアバターの類似性について
寺嶋縁里; 加藤晃茂; 佐野奈都貴; 亀田剛; 金子正秀; 寺田員人
Oral presentation, Japanese, 第17回日本顔学会大会(フォーラム顔学2012),第17回日本顔学会大会(フォーラム顔学2012)
Oct. 2012 - Facial expression recognition under partial occlusion using sub-block eigenphases
Gibran de Jesus; Benitez Garcia; Masahide Kaneko
Oral presentation, English, Proceedings of the UEC International Mini-Conference for Exchange Students on Electro-Communications and Information Science - No.28 -
Aug. 2012 - 位置合わせ誤差は再構成型超解像にどの程度影響するのか?
高橋桂太; 金子正秀
Public symposium, Japanese, 画像の認識・理解シンポジウム(MIRU2012), 電子情報通信学会パターン認識と学習研究会(PRMU), 福岡
Aug. 2012 - 動領域・静止領域の確率的マッピングを用いた動的環境の認識-自律移動ロボットにおける自己位置推定への応用-
伊藤明久; 高橋 桂太; 金子 正秀
Oral presentation, Japanese, 情報処理学会第74回全国大会,情報処理学会第74回全国大会
Mar. 2012 - 個性を持ったキャラクター表現が可能な3次元似顔絵の自動生成
梅村 隆; 高橋 桂太; 酒澤 茂之; 金子 正秀
Oral presentation, Japanese, 情報処理学会第74回全国大会,情報処理学会第74回全国大会
Mar. 2012 - 顔部品の形状・配置印象に基づく顔の全体的印象に対する定量的記述
遠藤 千麻; 高橋 桂太; 金子 正秀
Oral presentation, Japanese, 情報処理学会第74回全国大会,情報処理学会第74回全国大会
Mar. 2012 - 受取人の状態に応じて割込みのタイミングを変化させる配達ロボット
荒井 孝普; 高橋 桂太; 金子 正秀
Oral presentation, Japanese, 情報処理学会第74回全国大会,情報処理学会第74回全国大会
Mar. 2012 - Skin color extraction in outdoor environments based on GMM using Bumblebee stereo camera
Alejandro Larrauri; Masahide Kaneko
Oral presentation, English, The Proceedings of the 27h UEC International Mini-Conference for International Students(JUSST Program)
Mar. 2012 - Research on visual object tracking based on combination of TOF camera and single optical camera
Lixin Liu; Masahide Kaneko
Oral presentation, English, The Proceedings of the 27th UEC International Mini-Conference for International Students(JUSST Program)
Mar. 2012 - 個人の顔特徴を活かしたキャラクター表現を可能にする3次元似顔絵の自動生成
梅村隆; 高橋桂太; 酒澤茂之; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2012 - 横顔特徴に対する定量的分析及び横顔似顔絵の自動生成
許林; 高橋桂太; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2012 - 受取人の状態に応じて割込み行動を変化させる配達ロボット
荒井孝普; 高橋桂太; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2012 - 車部品の形状と配置に対する固有空間を用いた車のフロントフェースの特徴分析
彭璇; 金子正秀
Oral presentation, Japanese, 日本顔学会,第16回日本顔学会大会(フォーラム顔学2011)
Sep. 2011 - “顔”を工学的に科学する~コンピュータ似顔絵師の実現に向けて~
Others, Japanese, 講座「知っているようで知らない顔のナゾ~顔学入門~」第2回, 中日文化センター(名古屋・栄)
Aug. 2011 - 主成分分析を用いた車のフロントフェースの特徴解析と車似顔絵の生成
彭璇; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会,2011年映像情報メディア学会年次大会
Aug. 2011 - An improvement on bag of words model using PHOW descriptor and improved k-means clustering method for object categorization
Ying Wang; Masahide Kaneko
Oral presentation, English, The Proceedings of the 26th UEC International Mini-Conference for International Students(JUSST Program)
Aug. 2011 - Testing GMM algorithm for skin color segmentation in outdoor environments using a stereo camera
Alejandro Larrauri; Masahide Kaneko
Oral presentation, English, The Proceedings of the 26th UEC International Mini-Conference for International Students(JUSST Program)
Aug. 2011 - Study on particle filtering and fusion of stereo-camera and mono-camera for visual object tracking
Lixin Liu; Masahide Kaneko
Oral presentation, English, The Proceedings of the 26th UEC International Mini-Conference for International Students(JUSST Program)
Aug. 2011 - 聞き手の立ち位置関係を調節するロボット
板谷友彰; 金子正秀
Oral presentation, Japanese, 2011年電子情報通信学会総合大会,2011年電子情報通信学会総合大会
Mar. 2011 - 日常環境において同行者の動きに応じて安全に移動可能な自律移動ロボット
高橋和也; 金子正秀
Oral presentation, Japanese, 情報処理学会第73回全国大会,情報処理学会第73回全国大会
Mar. 2011 - 視野外の状況も考慮したロボットの自律的行動選択 ~ 音情報による物陰の人物の認識 ~
渡部翔; 金子正秀
Oral presentation, Japanese, 情報処理学会第73回全国大会,情報処理学会第73回全国大会
Mar. 2011 - Utilizing GPU for improving speed of iterative closest point algorithm based on CUDA
Jing Liang; Masahide Kaneko
Oral presentation, English, The Proceedings of the 25th UEC International Mini-Conference for International Students(JUSST Program)
Mar. 2011 - Improved bag of words model using PHOW descriptor for efficient face recognition
Ying Wang; Masahide Kaneko
Oral presentation, English, The Proceedings of the 25th UEC International Mini-Conference for International Students(JUSST Program)
Mar. 2011 - GPGPUによる顔特徴点の実時間検出に基づく似顔絵アニメーションの自動生成
須藤健児; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告、メディア工学、ME2011-2,映像情報メディア学会メディア工学研究会
Feb. 2011 - 自律移動ロボットにおける視野外の状況も考慮した衝突回避-音情報による物陰の人物の認識-
渡部翔; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告、メディア工学、ME2011-15,映像情報メディア学会メディア工学研究会
Feb. 2011 - 複数人物が任意の向きで着席した室内における挙手動作認識
肖凌; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告、メディア工学、ME2011-27,映像情報メディア学会メディア工学研究会
Feb. 2011 - 聞き手の立ち位置関係を調節するロボット
板谷友彰; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告、メディア工学、ME2011-28,映像情報メディア学会メディア工学研究会
Feb. 2011 - 親子各々の顔特徴の固有空間に基づく類似性判定
金青松; 金子正秀
Oral presentation, Japanese, 2010年映像情報メディア学会冬季大会,2010年映像情報メディア学会冬季大会
Dec. 2010 - 同行者との相対的位置関係を考慮した日常環境下でのロボットの自律的移動
高橋和也; 金子正秀
Oral presentation, Japanese, 2010年映像情報メディア学会冬季大会,2010年映像情報メディア学会冬季大会
Dec. 2010 - 動的環境に対する動・静止領域の確率的マッピングを用いた移動ロボットの自己位置推定
伊藤明久; 金子正秀
Oral presentation, Japanese, 2010年映像情報メディア学会冬季大会,2010年映像情報メディア学会冬季大会
Dec. 2010 - 似顔絵アニメーション生成のための顔特徴点の実時間抽出と追跡
須藤健児; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010),日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010)
Oct. 2010 - 物の形にたとえられる顔輪郭形状の定量的記述
遠藤千麻; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010),日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010)
Oct. 2010 - 横顔輪郭における個人性特徴の分析
許林; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010),日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010)
Oct. 2010 - 顔特徴の解析に基づく親子の顔の類似性の判定
金青松; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010),日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010)
Oct. 2010 - コンピュータ似顔絵師 ~ コンピュータによる似顔絵自動描画の実演デモ ~
須藤健児; 金青松; 金子正秀
Oral presentation, Japanese, 日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010),日本顔学会誌・第15回日本顔学会大会(フォーラム顔学2010)
Oct. 2010 - 視界推定に基づいたユーザの誤信念の認識が可能な人間共生ロボット
今井順一; 金子正秀
Oral presentation, Japanese, 第12回日本感性工学会大会予稿集,第12回日本感性工学会大会
Sep. 2010 - Occlusion, expression and illumination invariant face recognition using block-based bag of words
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
Oral presentation, English, 情報処理学会創立50周年記念(第72回)全国大会,情報処理学会創立50周年記念(第72回)全国大会
Mar. 2010 - 顔特徴点位置の統計的性質を利用した顔部品形状の抽出精度向上
森田圭介; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会創立50周年記念(第72回)全国大会,情報処理学会創立50周年記念(第72回)全国大会
Mar. 2010 - 周囲の複数歩行者の動きに応じて安全に自律移動するロボット
鈴木正也; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会創立50周年記念(第72回)全国大会,情報処理学会創立50周年記念(第72回)全国大会
Mar. 2010 - 動的環境における動領域・静止領域の認識に基づく自律移動ロボットの自己位置推定
伊藤明久; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会創立50周年記念(第72回)全国大会,情報処理学会創立50周年記念(第72回)全国大会
Mar. 2010 - Facial expression recognition using facial-component-based appearance and shape extraction
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
Oral presentation, English, 2010年電子情報通信学会総合大会,2010年電子情報通信学会総合大会
Mar. 2010 - 動領域・静止領域の確率的マッピングによる動物体追跡
伊藤明久; 今井順一; 金子正秀
Oral presentation, Japanese, 2010年電子情報通信学会総合大会,2010年電子情報通信学会総合大会
Mar. 2010 - ユーザの状態を察する機能を備えた対話型インタフェース
般若雄治; 今井順一; 金子正秀
Oral presentation, Japanese, 平成21年度電子情報通信学会東京支部学生会研究発表会(第15回),平成21年度電子情報通信学会東京支部学生会研究発表会(第15回)
Mar. 2010 - Facial point localization and its application to caricature software system
Niu Xing; Masahide Kaneko
Oral presentation, English, Proceedings of the 23rd UEC International Mini-Conference for International Students
Mar. 2010 - Blcok-based Bag of Wordsを用いた顔認識
黎子盛; 今井順一; 金子正秀
Public symposium, English, 顔学会アフタヌーンセミナー(顔情報処理ジョイントフォーラム 第I部), 日本顔学会, 東京
Mar. 2010 - 主成分分析を用いた横顔似顔絵の生成
許林; 今井順一; 金子正秀
Public symposium, Japanese, 顔学会アフタヌーンセミナー(顔情報処理ジョイントフォーラム 第I部), 日本顔学会, 東京
Mar. 2010 - 周囲歩行者の状態推定により動的環境に柔軟に対処可能な自律移動ロボット
鈴木正也; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学, ME2010-49,映像情報メディア学会技術報告, メディア工学研究会
Feb. 2010 - 顔特徴点位置の統計的性質を利用した顔部品形状の抽出精度向上と似顔絵作成
森田圭介; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学, ME2010-65,映像情報メディア学会技術報告, メディア工学研究会
Feb. 2010 - 顔特徴の言葉による記述と類似顔検索への応用
宮本慎也; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告, メディア工学, ME2010-77,映像情報メディア学会技術報告, メディア工学研究会
Feb. 2010 - 動領域・静止領域の確率的マッピングによる周囲環境の変化の検出
伊藤明久; 今井順一; 金子正秀
Oral presentation, Japanese, 2009年映像情報メディア学会冬季大会, 2-6,2009年映像情報メディア学会冬季大会
Dec. 2009 - 顔特徴の解析と言葉による記述
宮本慎也; 今井順一; 金子正秀
Oral presentation, Japanese, 2009年映像情報メディア学会冬季大会, 1-6,2009年映像情報メディア学会冬季大会
Dec. 2009 - オンライン物体モデリングを用いた遮蔽環境下での視覚追跡
今井順一; 金子正秀
Oral presentation, Japanese, 2009年映像情報メディア学会年次大会,2009年映像情報メディア学会年次大会
Aug. 2009 - Facial Feature Localization Using ASM with SIFT Descriptor
Li Zisheng; Jun-ichi Imai; Masahide Kaneko
Oral presentation, English, 2009年映像情報メディア学会年次大会,2009年映像情報メディア学会年次大会
Aug. 2009 - ロボットによる複数人の動きの観測に基づく並走・縦走の自律的切替え
高橋和也; 今井順一; 金子正秀
Oral presentation, Japanese, 2009年映像情報メディア学会年次大会,2009年映像情報メディア学会年次大会
Aug. 2009 - Facial Feature Localization Based on Statistical Models Using Local Gabor Binary Pattern and SVM Classifier
Zisheng Li; Jun-ichi Imai; Masahide Kaneko
Public symposium, English, 第15回画像センシングシンポジウム(SSII09), 画像センシングシンポジウム実行委員会, 横浜
Jun. 2009 - 周囲環境への働きかけ機能を有した移動ロボット
早川隆; 今井順一; 金子正秀
Oral presentation, Japanese, 平成20年度電子情報通信学会東京支部学生会研究発表会,平成20年度電子情報通信学会東京支部学生会研究発表会
Mar. 2009 - オクルージョンを含む多様な人物配置に応じた挙手動作認識
于澎; 今井順一; 金子正秀
Oral presentation, Japanese, 平成20年度電子情報通信学会東京支部学生会研究発表会,平成20年度電子情報通信学会東京支部学生会研究発表会
Mar. 2009 - Robust visual tracking with graph cuts in occlusion environments
Wei-ming Li; Jun-ichi Imai; Masahide Kaneko
Oral presentation, English, Proceedings of the 21st UEC International Mini-Conference for Exchange Students,The 21st UEC International Mini-Conference for Exchange Students
Mar. 2009 - 自律移動ロボットによる動的環境の認識
伊藤明久; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会,メディア工学研究会,ME2009-57,メディア工学研究会,ME2009-57
Feb. 2009 - マイクロホンアレーを用いた複数種音源位置推定及び種別判定
石井三知夫; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会, メディア工学研究会, ME2009-60,メディア工学研究会, ME2009-60
Feb. 2009 - 顔パーツの形状と配置に対するテンプレートの自動選択による似顔絵生成
土橋正和; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会,メディア工学研究会, ME2009-71,メディア工学研究会, ME2009-71
Feb. 2009 - Generation of expressive caricatures by learning expression transformation rule and caricaturist’s drawing style
李皆; 今井順一; 金子正秀
Oral presentation, English, 映像情報メディア学会,メディア工学研究会, ME2009-72,メディア工学研究会, ME2009-72
Feb. 2009 - [特別講演] 顔情報処理の研究あれこれ
Invited oral presentation, Japanese, 映像情報メディア学会、メディア工学研究会, 映像情報メディア学会、メディア工学研究会
Feb. 2009 - [フェロー記念講演] 顔画像情報処理の研究の拡がり
Invited oral presentation, Japanese, PRMU研究会, 電子情報通信学会 PRMU研究会
Dec. 2008 - 顔印象の定量的記述と類似顔検索への応用
高橋秀政; 今井順一; 金子正秀
Oral presentation, Japanese, 2008年映像情報メディア学会冬季大会,2008年映像情報メディア学会冬季大会
Dec. 2008 - 独立成分分析を用いた顔特徴の解析と似顔絵生成システムへの応用
李昌奉; 今井順一; 金子正秀
Oral presentation, Japanese, 2008年映像情報メディア学会冬季大会,2008年映像情報メディア学会冬季大会
Dec. 2008 - Comparisons of facial expression recognition in image sequences with and without speech
Li Zisheng; Jun-ichi Imai; Masahide Kaneko
Public symposium, English, 2008年映像メディア処理シンポジウム(IMPS2008), 電子情報通信学会 画像工学研究専門委員会 PCSJ&IMPS実行委員会
Oct. 2008 - 表情画像からの個人に依らない表情表現成分の抽出と似顔絵への表情付け
宮本慎也; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会誌・第13回日本顔学会大会(フォーラム顔学2008),第13回日本顔学会大会(フォーラム顔学2008)
Oct. 2008 - 対向者の歩行動作の観測と予測に基づくロボットの自律的すれ違い
伊藤明久; 今井順一; 金子正秀
Oral presentation, Japanese, 第7回情報科学技術フォーラム(FIT2008)/電子情報通信学会、情報処理学会,第7回情報科学技術フォーラム(FIT2008)
Sep. 2008 - Interpretation of human action in daily life scene based on action decomposition using terms in dictionary
Juanda Lokman; 今井順一; 金子正秀
Oral presentation, English, 第7回情報科学技術フォーラム(FIT2008)/電子情報通信学会、情報処理学会,第7回情報科学技術フォーラム(FIT2008)
Sep. 2008 - Illumination normalization for face image based on wavelet and brightness preserving dynamic histogram equalization
Ivan Kurniawan; Masahide Kaneko
Oral presentation, English, Proceedings of the 20th UEC International Mini-Conference for Exchange Students,The 20th UEC International Mini-Conference for Exchange Students
Aug. 2008 - 顔部品の形状特徴と配置の型を考慮した類似顔検索
金澤慧; 今井順一; 金子正秀
Oral presentation, Japanese, 2008年電子情報通信学会総合大会,2008年電子情報通信学会総合大会
Mar. 2008 - SIFT特徴量を利用した頭部モデルによる人物視界推定
今井順一; 金子正秀
Oral presentation, Japanese, 2008年電子情報通信学会総合大会,2008年電子情報通信学会総合大会
Mar. 2008 - 形状と配置の特徴及び全体的な印象を考慮した類似顔検索
金澤慧; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会 ME2008-18
Feb. 2008 - 動物の顔にたとえられる顔の特徴記述と類似度判定への応用
及川洋介; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会, ME2008-17
Feb. 2008 - 察するインタフェース ~人間とコンピュータ/知能ロボットとの間の新たなインタフェースの実現に向けて~
Others, Japanese, 第71回テレコム技術情報セミナー, 財団法人 テレコム先端技術研究支援センター
Oct. 2007 - 顔部品ごとの特徴と顔全体の印象を考慮した類似顔検索
金澤慧; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会,第12回日本顔学会大会(フォーラム顔学2007), P1-04
Sep. 2007 - 顔部品形状の階層的分類に基づく典型的形状の抽出
高橋秀政; 佐藤夕介; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会,第12回日本顔学会大会(フォーラム顔学2007), P1-05
Sep. 2007 - 顔部品の形状と配置に対する主成分分析に基づく日本人と欧米人の顔特徴の比較
李皆; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会,第12回日本顔学会大会(フォーラム顔学2007), P1-10
Sep. 2007 - 似顔絵生成システムにおける顔特徴点の高精度自動抽出方法
土橋正和; 今井順一; 金子正秀
Oral presentation, Japanese, 日本顔学会,第12回日本顔学会大会(フォーラム顔学2007), P2-02
Sep. 2007 - Audio-visual speaker detection in human-robot interaction
Thatsaphan Suwannathat; Jun-ichi Imai; Masahide Kaneko
Oral presentation, English, 日本機械学会ロボット・メカトロニクス部門,ROBOMEC2007(ロボティクス・メカトロニクス講演会2007
May 2007 - 視覚的遮蔽物のある環境下でのロボット及びユーザの視界推定
今井順一; 滝川武士; 金子正秀
Public symposium, Japanese, 動画像処理実利用化ワークショップ2007, 動画像処理実利用化ワークショップ2007 DIA2007, 札幌
Mar. 2007 - 解像度の違いにロバストなまばたき検出を利用したベストショット画像の自動生成
尾崎勇也; 今井順一; 金子正秀
Oral presentation, Japanese, 電子情報通信学会技術研究報告, 画像工学研究会
Mar. 2007 - 階層的分類手法を利用した顔印象語と顔部品形状との対応付け
佐藤夕介; 今井順一; 金子正秀
Oral presentation, Japanese, 電子情報通信学会技術研究報告, 画像工学研究会
Mar. 2007 - 画像情報に基づき自律的にユーザとの並走・縦走の切替えが可能なロボットの実現
花井久美江; 今井順一; 金子正秀
Oral presentation, Japanese, 電子情報通信学会技術研究報告, 画像工学研究会
Mar. 2007 - 固有空間法による似顔絵の表情生成技術を応用した携帯電話向け電子メーラの試作
松尾賢治; 佐藤夕介; 橋本真幸; 小池淳; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会研究報告, オーディオビジュアル複合情報処理研究会
Mar. 2007 - サービスロボットにおける複数ユーザからの指示に対する応答順序決定のための優先度判断
池田新樹; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会第69回全国大会
Mar. 2007 - 解像度の違いにロバストなまばたき検出とベストショット画像の自動生成
尾崎勇也; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会第69回全国大会
Mar. 2007 - クラスタ分析による顔部品形状の階層的分類と顔印象語との対応付け
佐藤夕介; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会第69回全国大会
Mar. 2007 - ユーザに同行するロボットにおける状況に応じた並走・縦走の自律的切替え
花井久美江; 今井順一; 金子正秀
Oral presentation, Japanese, 情報処理学会第69回全国大会
Mar. 2007 - 複数ユーザからの指示に対するサービスロボットの応答順序決定方法
池田新樹; 今井順一; 金子正秀
Oral presentation, Japanese, 電子情報通信学会2007年総合大会ISS特別企画「学生ポスターセッション」
Mar. 2007 - 顔特徴の主成分分析に基づく似顔絵をインタフェースとした顔画像データベース検索
小林聖治; 今井順一; 金子正秀
Oral presentation, Japanese, 映像情報メディア学会技術報告,メディア工学研究会
Feb. 2007 - 顔特徴の高精度自動抽出と抽出座標値に対する主成分分析に基づく似顔絵生成システム
土橋正和; 今井順一; 金子正秀
映像情報メディア学会技術報告, メディア工学研究会
Feb. 2007 - 対象の自律的切替え機構を持つパーティクルフィルタによる遮蔽環境下での視覚追跡
今井順一; 金子正秀
Jan. 2007 - 対象の自律的切り替えによる遮蔽に頑健な視覚追跡
今井順一; 金子正秀
Sep. 2006 - まばたきの自動検出とベストショット撮影への応用 -- 目領域の切出しとまばたき判定方法に関する検討 --
尾崎勇也; 今井順一; 金子正秀
Sep. 2006 - クラスタ分析による顔部品の典型的形状抽出とその階層的分類
佐藤夕介; 今井順一; 金子正秀
Sep. 2006 - Interpretation of ambiguous human actions based on object information and relationship,”
Juanda Lokman; 今井順一; 金子正秀
動的画像処理実利用化ワークショップDIA2006, 動的画像処理実利用化ワークショップDIA2006, 滋賀県草津市
Mar. 2006 - Automatic extraction of moving humans from a moving platform
Thatsaphan Suwannathat; 今井順一; 金子正秀
動的画像処理実利用化ワークショップDIA2006, 動的画像処理実利用化ワークショップDIA2006, 滋賀県草津市
Mar. 2006 - 視聴覚情報の統合に基づく全周方向での音源位置推定
高橋哲史; 今井順一; 金子正秀
電子情報通信学会技術研究報告, マルチメディア・仮想環境基礎研究会,電子情報通信学会技術研究報告, マルチメディア・仮想環境基礎研究会
Mar. 2006 - マルチモーダル情報に基づくユーザ毎の優先度を考慮したロボットとユーザとのコミュニケーション
崔元杰; 今井順一; 金子正秀
電子情報通信学会技術研究報告, マルチメディア・仮想環境基礎研究会,電子情報通信学会技術研究報告, マルチメディア・仮想環境基礎研究会
Mar. 2006 - 人間共存型ロボットにおけるユーザやオブジェクトとの相対的位置関係の把握とインタラクションへの応用
立木翔一; 今井順一; 金子正秀
電子情報通信学会技術研究報告, マルチメディア・仮想環境基礎研究会,電子情報通信学会技術研究報告, マルチメディア・仮想環境基礎研究会
Mar. 2006 - Interpretation of human actions for each body part based on object information and similitude
Juanda Lokman; 今井順一; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会,電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会
Mar. 2006 - 線形判別分析による表情特徴と顔特徴の分離と似顔絵アニメーションへの応用
沙秀; 今井順一; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会,電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会
Mar. 2006 - ロボットとユーザとのインタラクションにおけるロボット・ユーザ・オブジェクトとの相対的位置関係の取扱い,”情, , 2006.3.7.
立木翔一; 今井順一; 金子正秀
Mar. 2006 - 線形判別分析を用いた表情ベクトルの分離による似顔絵アニメーションの生成
沙秀; 今井順一; 金子正秀
Mar. 2006 - 複数ユーザとコミュニケーションするロボットにおけるマルチモーダル情報に基づくユーザ毎の優先度判定
崔元杰; 今井順一; 金子正秀
Mar. 2006 - マルチモーダル情報に基づくユーザ毎の優先度を考慮したロボットとユーザとのコミュニケーション
崔元杰; 今井順一; 金子正秀
Dec. 2005 - オブジェクトとの相対的位置関係を考慮したロボットとユーザとのインタラクション
立木翔一; 今井順一; 金子正秀
Dec. 2005 - Interpretation of Emotional Gestures by Considering Hands Positions and Face Features
Li Jie; Juanda Lokman; Jun-ichi Imai; Masahide Kaneko
FIT2005 (第4回情報科学技術フォーラム),FIT2005 (第4回情報科学技術フォーラム)
Sep. 2005 - 個々の似顔絵画家の描画スタイルを反映したコンピュータによる似顔絵生成
沙秀; 今井順一; 金子正秀
Sep. 2005 - Interpretation of emotional gestures by considering hands positions and face features
Jie Li; Masahide Kaneko
Proc. of the 14th UEC International Mini-Conference for Exchange Students, Proc. of the 14th UEC International Mini-Conference for Exchange Students
Aug. 2005 - 形状と配置特徴を独立に制御可能な顔画像のインタラクティブ操作システム ―顔特徴の解析と似顔絵生成への応用―
西野史康; 金子正秀
Mar. 2005 - 多人数が写った画像にも適用可能なまばたき検出及びベストショットの自動選択
入江淳; 金子正秀
動的画像処理実利用化ワークショップ2005, 動的画像処理実利用化ワークショップ2005
Mar. 2005 - 曖昧さを含んだ空間指示に対するマルチモーダルによる解釈とロボットの動作制御への応用
北澤幸吉; 金子正秀
動的画像処理実利用化ワークショップ2005, 動的画像処理実利用化ワークショップ2005
Mar. 2005 - 人間型ロボットとユーザとの間での顔アクションに基づく共感と反応
高田元一郎; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会, HCS2004-49
Mar. 2005 - 顔特徴の印象表現に対する定量的分析と入力顔判別への応用
西野史康; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会, HCS2004-51
Mar. 2005 - 視聴覚情報の統合による音源の3次元位置推定と移動追跡
北澤幸吉; 陳彬; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会, HCS2004-63
Mar. 2005 - Understanding Human Activity under Considering Constraint Relationship with Objects
Juanda Lokman; Masahide Kaneko
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会, HCS2004-55
Mar. 2005 - 顔のアクションに着目した人とロボットとの共感コミュニケーション
高田元一郎; 金子正秀
Mar. 2005 - 顔部品の形状と配置に関する固有空間を用いた性別・表情分析と似顔絵生成
西野史康; 金子正秀
Mar. 2005 - 顔部品の大きさと形状の特徴を分離して扱うことが可能な似顔絵生成システム
佐藤夕介; 金子正秀
Mar. 2005 - 視聴覚情報の統合に基づく全周方向での音源位置推定
高橋哲史; 金子正秀
Mar. 2005 - 空間内における相対的位置関係を考慮した知能ロボットとユーザとのインタラクション
立木翔一; 金子正秀
Mar. 2005 - Interpretation of Activities of Human Body Parts Based on Sequence of Joint Angles under Considering Constraint Relationship with Objects
Juanda Lokman; Masahide Kaneko
Mar. 2005 - Detection of Moving Humans From Navigating Robot Using Two Cooperative Vision Platforms
Thatsaphan Suwannnathat; Masahide Kaneko
Mar. 2005 - まばたき検出に基づくベストショットの選択及び加工
入江淳; 金子正秀
Mar. 2005 - Motion Detection using Omni-Directional Camera Mounted on Moving Platform
Thatsaphan Suwannathat; Masahide Kaneko
Mar. 2005 - Navigation system for omnidirectional mobile robot by wall following method
Vanichtanasri Thitipun; Masahide Kaneko
Proceedings of the 13th UEC International Mini-Conference for Exchange Students, Proceedings of the 13th UEC International Mini-Conference for Exchange Students
Mar. 2005 - Interpretation of face and hand gestures in human-robot interaction
Li Jie; Masahide Kaneko
Proceedings of the 13th UEC International Mini-Conference for Exchange Students, Proceedings of the 13th UEC International Mini-Conference for Exchange Students
Mar. 2005 - 顔アクションをキーとした人とロボットとの共感インタラクション
高田元一郎; 金子正秀
Feb. 2005 - Understanding Concurrent Activities of Human in Daily Lives by Hierarchical Interpretation of Each Body Part
Juanda Lokman; Masahide Kaneko
Sep. 2004 - 主成分分析を用いた男女別の顔特徴解析と似顔絵生成への応用
西野史康; 金子正秀
Sep. 2004 - ロボットの動き情報を重視した選択的注意モデルに基づくユーザとロボットとのインタラクション
陳彬; 金子正秀
動的画像処理実利用化ワークショップ 2004, 動的画像処理実利用化ワークショップ 2004講演論文集
Mar. 2004 - 画像中の動きと色特徴及び音源位置推定結果を用いたロボットによる移動人物の追跡
北澤幸吉; 陳彬; 金子正秀
動的画像処理実利用化ワークショップ 2004, 動的画像処理実利用化ワークショップ 2004講演論文集
Mar. 2004 - ユーザとの対話に基づいた実世界中オブジェクトのインタラクティブ探索
西田寿雄; 金子正秀
Mar. 2004 - ユーザからの曖昧さを伴った指示に基づく実環境内のオブジェクトの探索
西田寿雄; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーシ ョン基礎研究会HCS2003-63
Mar. 2004 - ゲイン調整機能を付加した一般化荷重メジアンフィルタによる画像復元
目黒光彦; 金子正秀; 榑松明
Nov. 2003 - 簡易なインタラクティブ操作と領域判定規則を用いた画像からの人物領域抽出
服部智広; 目黒光彦; 金子正秀
Nov. 2003 - シーン内に置かれた物体の室内時系列画像からの検出
藤井朝子; 目黒光彦; 金子正秀
電子情報通信学会総合大会講演論文集, D-12-108
Mar. 2003 - チューブによるオブジェクト表現を用いた動画像の簡易記述と生成
羽賀正信; 目黒光彦; 金子正秀
情報処理学会第65回全国大会, 3R-5
Mar. 2003 - ユーザとのインタラクションにおけるロボットの注意先の選択
陳彬; 目黒光彦; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会, HCS2002-56
Mar. 2003 - 固有空間法による顔特徴の解析と似顔絵の生成
水野友和; 目黒光彦; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会, HCS2002-53
Mar. 2003 - チューブによる動画像オブジェクトの表現 --- 動画像の簡易記述・生成への適用 ---
羽賀正信; 目黒光彦; 金子正秀
画像電子学会第200回研究会講演予稿, 02-07-19
Mar. 2003 - 室内シーンを対象とした時系列画像における物体領域の検出と物体位置情報の記録
藤井朝子; 目黒光彦; 金子正秀
第4回動画像処理実利用化ワークショップ講演論文集, P10
Mar. 2003 - 複数ユーザの会話シーンにおける話者注意対象の検出
陳彬; 目黒光彦; 金子正秀
第4回動画像処理実利用化ワークショップ講演論文集, P9
Mar. 2003 - クロスモーダルアテンションモデルに基づくロボットの視線方向の自動選択
名取洋一; 陳彬; 目黒光彦; 金子正秀
第4回動画像処理実利用化ワークショップ講演論文集, 11
Mar. 2003 - 視聴覚情報を統合した話者注意対象の検出
陳彬; 目黒光彦; 金子正秀
Feb. 2003 - コンピュータは似顔絵描きになれるか --- コンピュータによる顔特徴の解析と似顔絵の生成 ---
Dec. 2002 - 擬人化エージェントにおける視聴覚アテンション機能の実現
陳彬; 目黒光彦; 金子正秀
計測自動制御学会第3回システムインテグレーション部門講演会(SI 2002)講演論文集(I), 1P23-03
Dec. 2002 - 知的画像情報処理とアクティブヒューマンインタフェース ~ 画像を主体としたマルチメディア情報による新たな情報環境の構築 ~
金子正秀; 目黒光彦
電気通信大学研究開発交流会分科会6, 音声処理・画像処理
Nov. 2002 - 室内監視カメラ画像に対する動物体に着目したシーン分類
藤井朝子; 目黒光彦; 金子正秀
2002年映像情報メディア学会冬季大会講演予稿集, 10-6
Nov. 2002 - 顔部品形状の固有空間による分析
水野友和; 目黒光彦; 金子正秀
2002年映像情報メディア学会冬季大会講演予稿集, 10-3
Nov. 2002 - 画像復元のための周波数選択特性を有する一般化荷重メジアンフィルタの最適設計法
目黒光彦; 金子正秀; 榑松明
2002年映像情報メディア学会冬季大会講演予稿集, 10-2
Nov. 2002 - 画像処理のための周波数選択特性を有する荷重メジアンフィルタの設計法
目黒光彦; 金子正秀; 榑松明
電子情報通信学会ディジタル信号処理研究会, 第17回ディジタル信号処理シンポジウム, D3-3
Nov. 2002 - ユーザとロボットとのインタラクションにおけるアテンションの取扱い --- 視覚・聴覚情報に基づくアテンションの形成と利用 --
陳彬; 目黒光彦; 金子正秀
Oct. 2002 - 顔姿勢推定に基づくユーザとロボットとの共同注意の形成
陳彬; 目黒光彦; 金子正秀
平成14年電気学会, 電子・情報・システム部門大会講演論文集, OS5-9
Sep. 2002 - 人間の肌色モデルの作成と顔検出への応用
Quan Huynh-Thu; 目黒光彦; 金子正秀
フォーラム顔学2002(第7回日本顔学会大会), P-2-5
Sep. 2002 - ユーザとロボットとのインタラクションにおける共同注意の形成手法
陳彬; 目黒光彦; 金子正秀
情報科学技術フォーラム(FIT2002)講演論文集, 第3分冊, K-22
Sep. 2002 - インタラクティブ操作による緩やかな拘束条件と領域判定規則に基づくオブジェクトの抽出
服部智広; 目黒光彦; 金子正秀
情報科学技術フォーラム(FIT2002)講演論文集, 第3分冊, J-6
Sep. 2002 - 周波数選択特性を有する荷重メジアンフィルタによる雑音で劣化した画像の復元
目黒光彦; 金子正秀; 榑松明
情報科学技術フォーラム(FIT2002)講演論文集, 第3分冊, J-1
Sep. 2002 - Gaussian mixture modeling of skin color and adaptive thresholding for face detection
Quan Huynh-Thu; Mitsuhiko Meguro; Masahide Kaneko
情報科学技術フォーラム(FIT2002)講演論文集, 第3分冊, I-101
Sep. 2002 - インタラクティブな操作による緩やかな拘束を利用したカラー画像からのオブジェクトの抽出
服部智広; 目黒光彦; 金子正秀
2002年映像情報メディア学会年次大会, 20-6
Aug. 2002 - 注視共有度マップを表す顕著性マップの顔姿勢推定による計算
陳彬; 目黒光彦; 金子正秀
2002年映像情報メディア学会年次大会, 17-2
Aug. 2002 - 会議レポート 2001年映像情報メデイア学会冬季大会報告
Apr. 2002 - 動画像から獲得した人間の歩行動作パターンに基づく移動ロボットの動作制御
関剣; 目黒光彦; 金子正秀
2002年電子情報通信学会総合大会講演論文集(基礎・境界部門), A-16-38
Mar. 2002 - 領域追跡により生成されたチューブに基づく動画像の時空間領域分割
目黒光彦; 金子正秀; 榑松明
2002年電子情報通信学会総合大会講演論文集(情報・システム部門), D-11-84
Mar. 2002 - 音声に対応した口形状変化を有する似顔絵アニメーションの生成
山田清香; 目黒光彦; 金子正秀
電子情報通信学会技術研究報告, ヒューマンコミュニケーション基礎研究会 HCS 2001-51
Mar. 2002 - 対象の時空間配置に着目したインタラクションにおける指示語の曖昧さに対する処理
竹内伸吾; 目黒光彦; 金子正秀
インタラクション2002論文集(情報処理学会), IA-28
Mar. 2002 - 少数の透視投影画像に基づいて生成された仮想空間における3次元移動表現
杉山慎; 目黒光彦; 金子正秀
電子情報通信学会技術研究報告, マルチメディア・仮想環境基礎研究会 MVE 2001-148
Mar. 2002 - 総評:動画像の現状を斬る
橋本周司; 輿水大和; 山本和彦; 山本新; 金子正秀
第3回動画像処理実利用化ワークショップ, 総合討論
Mar. 2002 - 総評:動画像の現状を斬る
橋本周司; 輿水大和; 山本和彦; 山本新; 金子正秀
第3回動画像処理実利用化ワークショップ, 総合討論
Mar. 2002 - 少数の透視投影画像に基づく視点位置と視線方向の3次元移動の表現
杉山慎; 目黒光彦; 金子正秀
2001年映像情報メディア学会冬季大会講演予稿集, 12-7
Dec. 2001 - 特徴強調を考慮した似顔絵アニメーションにおける口形状表現
山田清香; 目黒光彦; 金子正秀
2001年映像情報メディア学会冬季大会講演予稿集, 12-8
Dec. 2001 - チューブ生成に基づく動画像の時空間領域分割とオブジェクト抽出への応用
目黒光彦; 金子正秀; 榑松明
2001年映像情報メディア学会冬季大会講演予稿集, 12-4
Dec. 2001 - 会議レポート 2001年映像情報メディア学会年次大会
Dec. 2001 - 少数の透視投影画像に基づく3次元シーンの簡易モデリングとウォークスルー
杉山慎; 目黒光彦; 金子正秀
2001年映像メディア処理シンポジウム(IMPS2001), I-3.02
Nov. 2001 - 曖昧さを含んだ時空間指示によるコンピュータとのインタラクション
竹内伸吾; 目黒光彦; 金子正秀
2001年映像メディア処理シンポジウム(IMPS2001), I-4.08
Nov. 2001 - フレームごとの領域修正に基づく動画像からのオブジェクト抽出
目黒光彦; 金子正秀; 榑松明
2001年映像メディア処理シンポジウム(IMPS2001), I-1.02
Nov. 2001 - コンピュータによる似顔絵の作成とアニメーション化
金子正秀; 呂玲; 山田清香
日本映像学会 映像心理学研究会第10回研究会
Nov. 2001 - コンピュータによる似顔絵の作成とアニメーション化
金子正秀; 呂玲; 山田清香
日本映像学会 映像心理学研究会第10回研究会
Nov. 2001 - 曖昧さを含んだ言葉を用いた空間指示によるコンピュータとのインタラクション
竹内伸吾; 目黒光彦; 金子正秀
ヒューマンインタフェースシンポジウム2001(HIS2001), No.2526
Oct. 2001 - 少数の透視投影画像に基づく擬似3次元シーンの自動生成
杉山慎; 目黒光彦; 金子正秀
2001年電子情報通信学会基礎・境界ソサイエティ大会講演論文集, A-16-8
Sep. 2001 - 対象の時空間配置を表す言葉を用いたコンピュータとの知的インタラクション
竹内伸吾; 目黒光彦; 金子正秀
2001年電子情報通信学会基礎・境界ソサイエティ大会講演論文集, A-15-10
Sep. 2001 - マイクロホンアレーと音声分離を用いた自動車内における音声の強調と認識
長井隆行; 金子正秀; 榑松明
2001年電子情報通信学会基礎・境界ソサイエティ大会講演論文集, A-4-32
Sep. 2001 - 口形状変化の表現による似顔絵のアニメーション化
山田清香; 目黒光彦; 金子正秀
日本顔学会誌(第6回日本顔学会大会(フォーラム顔学2001), P-6-8)
Sep. 2001 - 表情変化を伴った似顔絵アニメーションの生成
呂玲; 目黒光彦; 金子正秀
日本顔学会誌(第6回日本顔学会大会(フォーラム顔学2001), P-6-9)
Sep. 2001 - 固有空間を利用した似顔絵の作成と口形状変化の表現
山田清香; 金子正秀
Jul. 2001 - マイクロホンアレーを用いた話者位置推定による車載音声認識
近藤啓介; 長井隆行; 金子正秀; 榑松 明
電子情報通信学会技術研究報告, 回路とシステム研究会 CAS2000-112(ディジタル信号処理研究会 DSP2000-170,通信方式研究会 CS2000-132)
Mar. 2001 - 情景画像中の文字及び看板領域の抽出
長井隆行; 影広達彦; 金子正秀; 榑松 明
電子情報通信学会技術研究報告,回路とシステム研究会 CAS2000-125(ディジタル信号処理研究会 DSP2000-183, 通信方式研究会 CS2000-145)
Mar. 2001 - MPEG符号化されたサッカー映像に対するシーン分類手法
玄蕃一輝; 金子正秀; 榑松 明
情報処理学会第62回(平成13年前期)全国大会講演論文集, 6L-6
Mar. 2001 - 情景画像に対する情報インタフェースとしての看板文字の抽出
傅 杭; 長井隆行; 金子正秀; 榑松 明
情報処理学会第62回(平成13年前期)全国大会講演論文集, 2M-3
Mar. 2001 - 屋内外の情景画像を対象とした看板文字の自動抽出
傅 杭; 長井隆行; 金子正秀; 榑松 明
電子情報通信学会技術研究報告, 画像工学研究会 IE2000-157(電子ディスプレイ研究会 EID2000-302)
Jan. 2001 - 会議レポート PCSJ2000/IMPS2000
Jan. 2001 - 情景画像中の看板領域の抽出
傅杭; 長井隆行; 金子正秀; 榑松 明
2000年映像情報メディア学会冬季大会講演予稿集, 1-5
Dec. 2000 - MPEG符号化データを利用したサッカー映像の自動分類
玄蕃一輝; 金子正秀; 榑松 明
2000年映像情報メディア学会冬季大会講演予稿集, 1-6
Dec. 2000 - 情景画像からの情報取得を目的とした看板文字の自動認識
傅 杭; 長井隆行; 金子正秀; 榑松 明
2000年電子情報通信学会情報・システムソサイエティ大会講演論文集, D-12-23
Sep. 2000 - 2次元MUSIC法による話者位置推定を用いた車載音声認識
近藤啓介; 長井隆行; 金子正秀; 榑松 明
2000年電子情報通信学会情報・システムソサイエティ大会講演論文集, SD-2-4
Sep. 2000 - 似顔絵生成における画調と顔特徴の操作
金子正秀; 徐光哲; 榑松 明
第5回日本顔学会大会(フォーラム顔学2000)予稿集, C-12
Aug. 2000 - 電気通信大学大学院電気通信学研究科電子工学専攻 金子研究室
日本学術振興会 次世代映像メディア第159委員会 平成11年度活動報告
Jun. 2000 - 車載音声認識のための2次元MUSIC法を用いた話者位置推定
近藤啓介; 長井隆行; 金子正秀; 榑松 明
Mar. 2000 - ニューラルネットワークを用いた音声と顔画像のバイモーダル情報による感情認識
根本直樹; 榑松 明; 金子正秀; 長井隆行
Mar. 2000 - 顔部品の形状特徴と配置特徴の強調による似顔絵の生成
徐 光哲; 金子正秀; 榑松 明
電子情報通信学会技術研究報告,ヒューマン情報処理研究会,HIP 99-50
Nov. 1999 - 固有空間の切り替えによる異なる画調の似顔絵の生成
徐 光哲; 金子正秀; 榑松 明
Sep. 1999 - 固有空間を利用した似顔絵の自動生成
徐 光哲; 金子正秀; 榑松 明
Aug. 1999 - 顔画像処理技術とその応用に関する最近の研究動向
金子正秀; 長谷川 修
Aug. 1999 - 顔部品の形状と配置に関する固有空間を利用した似顔絵の生成
徐 光哲; 金子正秀; 榑松 明
Aug. 1999 - 知的画像符号化とその拡張による顔画像の処理
パク ミンチョル,N; P. チャンドラシリ; 苗村 健; 金子正秀; 原島 博
Aug. 1999 - 顔画像認識・合成用公開ソフトウェア…アドバンストエージェントプロジェクト…
金子正秀; 舩木謹也; 原島 博
Aug. 1999 - 似顔絵の自動生成における顔特徴の強調
徐 光哲; 金子正秀; 榑松 明
Aug. 1999 - 電気通信大学大学院電気通信学研究科電子工学専攻 金子研究室
日本学術振興会 次世代映像メディア第159委員会 平成10年度活動報告
May 1999 - 異なるフィルタ長をもつ重複直交変換の実現とサブバンド画像符号化への応用
長井隆行; 池原雅章; 金子正秀; 榑松 明
電子情報通信学会技術研究報告,ディジタル信号処理, DSP98-182(CAS98-92, CS98-145)
Mar. 1999 - Improvement of analysis and synthesis in facial image sequence using referential frames
Min Chul Park; Takeshi Naemura; Masahide Kaneko; Hiroshi Harashima
映像メディア処理シンポジウム(IMPS '98),I-1.09
Oct. 1998 - 大型スクリーン環境における多人数鑑賞用ステレオ表示
苗村 健; 金子正秀; 原島 博
日本バーチャルリアリティ学会第3回大会(VRSJ '98)
Aug. 1998 - 画像情報と光線情報の相互変換における可逆性
竹内敬亮; 苗村 健; 金子正秀; 原島 博
Jul. 1998 - 多次元DCTを用いた空間符号化の特性評価
高野孝英; 村上貴将; 苗村 健; 金子正秀; 原島 博
3次元画像コンファレンス '98,5-5
Jul. 1998
- Topics in Mechatronical and Intelligent Systems Engineering Ⅱ(Visual Communications)
The University of Electro-Communications - Topics in Mechatronical and Intelligent Systems Engineering Ⅱ(Visual Communications)
電気通信大学 - コンピュータビジョン特論
The University of Electro-Communications - コンピュータビジョン特論
電気通信大学 - Visual Communications
The University of Electro-Communications - Visual Communications
電気通信大学 - 信号処理工学
The University of Electro-Communications - 信号処理工学
電気通信大学 - ヒューマンインタフェース
The University of Electro-Communications - ヒューマンインタフェース
Affiliated academic society
Industrial Property Rights
- 物体追跡装置、異常状態検知装置及び物体追跡方法
Patent right, 今井順一, 金子正秀, 特願2006-95587, Date applied: 30 Mar. 2006, 国立大学法人電気通信大学, 特開2007-272436, Date announced: 18 Oct. 2007, 特許第4769943号, Date issued: 01 Jul. 2011 - 顔特徴抽出装置及び顔特徴抽出方法
Patent right, 金子正秀, 今井順一, 木村敢, 特願2006-95586, Date applied: 30 Mar. 2006, 国立大学法人電気通信大学 - 肌色領域検出装置及び肌色領域検出方法
Patent right, 金子正秀, 今井順一, 高橋哲史, 特願2006-77692, Date applied: 20 Mar. 2006, 国立大学法人電気通信大学 - ロボット装置及びそのコミュニケーション方法
Patent right, 金子正秀, 今井順一, 崔元杰, 特願2006-77693, Date applied: 20 Mar. 2006, 国立大学法人電気通信大学
- 博士前期課程の研究指導を行った中村和樹君が、映像情報メディア学会メディア工学研究会学生研究発表会での論文発表に対して、同研究会より優秀発表賞を授与された。(2018.2.24.受賞)
2017 - 2017 - 博士前期課程の研究指導を行った海老沢賢汰君が、映像情報メディア学会メディア工学研究会学生研究発表会での論文発表に対して、同研究会より研究奨励賞を授与された。(2018.2.24.受賞)
2017 - 2017 - 博士前期課程の研究指導を行った坂本裕貴君が、映像情報メディア学会メディア工学研究会学生研究発表会での論文発表に対して、同研究会より研究奨励賞を授与された。(2018.2.24.受賞)
2017 - 2017 - 卒業論文の研究指導を行った長野匡隼君が、情報処理学会第80回全国大会での論文発表に対して、同学会より学生奨励賞を授与された。(2018.3.15.受賞)
2017 - 2017 - 博士前期課程の研究指導を行った芝田伊吹君が、映像情報メディア学会メディア工学研究会学生研究発表会での論文発表に対して、同研究会より優秀発表賞を授与された。(2017.2.18.受賞)
2016 - 2016 - 博士前期課程の研究指導を行った平林謙太郎君が、映像情報メディア学会メディア工学研究会学生研究発表会での論文発表に対して、同研究会より研究奨励賞を授与された。(2017.2.18.受賞)
2016 - 2016 - 博士後期課程の研究指導を行った張斌君が、国際会議ICSR2016(Eighth International Conference on Social Robotics (ICSR2016)でBest Student Paper Awardを受賞した。(2016.11.3.受賞)
2016 - 2016 - 博士後期課程の研究指導を行った張斌君が、日中科学技術交流協会より中国人留学生研究奨励賞を受賞した。 (2017.1.11.受賞)
2016 - 2016