책소개
과거에 과학자들은 연구 결과의 요약을 보고했지만, 원본 데이터는 제공하지 않았다. 많은 연구 과제들에서 원본 데이터의 수집을 요구하고 있다. 연구 과정의 낭비와 결손을 완화하기 위해서 이다. 동시에, 데이터 큐레이션에 필요한 인프라(예: 저장소)도 진화하고 있다. 현재의 목표는 연구 제품을 공정하게 만드는 것이다(Findable, Accessible, Interoperativeable, Reusable). 따라서 인간과 기계의 양립이 가능하도록 커리큘럼되고 보관되는 데이터가 생성된다. 그러나 대부분의 과학자들은 데이터 큐레이션에 대한 교육을 거의 받지 못하고 있다. 구체적으로, 그들은 발견성, 통합 및 광범위한 재사용을 용이하게 하는 수준에서 그들의 데이터 수집에 주석을 달기엔 적합하지 않다. 이러한 결함을 피하기 위해 데이터 설계자는 데이터를 변환하고 큐레이션하기 위해 과학자들과 협력할 수 있다. 이 논문의 데이터 수집 예는 포유류 콜레아에서 분리된 외부 머리카락 세포의 전기적 특성을 설명한다. 데이터는 계층적 데이터 형식 버전 5(HDF5) 형식에서 사용되는 메타데이터 및 중첩 데이터 아키텍처를 제공하기 위해 미러링된 OBI(Ontology for Biomical Researchs)의 변형으로 표현된다. 각 디지털 샘플은 트리 구성(컴퓨터의 디렉터리처럼)으로 표시되며 온톨로지 클래스를 기반으로 6개의 주요 분기로 구성된다. 데이터 수집, 스크립트 및 존재론 OBL(ObI based Inner Electrophysiology, OBI_IEE) 파일(ObI based Inner Earloric Electrophysiology, OBI_IEE)은 3개의 리포지토리에 보관된다.
목차
제 1편 : MATLAB 기본편
1. MATLAB 기본사용편 003
1.1 MATLAB 시작하기 003
명령창(command Window)에서의 입력 005
도움말(Help)의 이용 007
1.2 입력 오류의 수정 008
계산의 중지 009
MATLAB 종료하기 009
1.3 연산과 변수의 할당 009
연산자 우선순위 011
내장함수 012
1.4 데이터의 표현 013
1.5 변수의 처리 015
변수 이름 015
clear 명령어 016
특수변수와 정수 017
whos 명령어 017
1.6 벡터와 행렬 018
벡터 018
행렬 023
스크린 출력과 억제 024
1.7 랜덤(Random)수와 복소수 025
랜덤 수 025
복소수 027
1.8 기호를 이용한 연산 028
기호식에서의 치환 029
1.9 코드 파일 030
스크립트 코드 파일 030
코멘트의 추가 032
함수 코드 파일 033
사용자 정의함수 036
1.10 간단한 그래프의 생성 037
ezplot을 이용한 그래프 037
plot을 이용한 그래프 039
3차원 그래프 042
1.11 MATLAB과 엑셀(Excel)의 접속 043
엑셀 데이터 불러오기 043
데이터 가져오기 옵션 046
스크립트 생성 옵션 049
함수 생성 옵션 049
생성된 데이터를 엑셀파일로 저장하기 050
제 2편 : 연구논문
Scientist and data architect collaborate to curate and archive an inner ear electrophysiology data collection
1. Introduction 51
2. Description of data 52
3. Data management plan 56
4. Design data architecture based upon ontology 61
5. Packaging, licensing and storing the data 63
6. Results and discussion 64
7. Transformation to HDF5 from MATLAB and harvest from HDF5 by MATLAB 66
8. Concluding remarks 69
9. References 71