Aritalab:Lecture/Programming/Cpp

From Metabolomics.JP
Jump to: navigation, search
Wiki Top Up one level レポートの書き方 Arita Laboratory

Contents

"C makes it easy to shoot yourself in the foot; C++ makes it harder, but when you do it blows your whole leg off."

Bjarne Stroustrup

C++プログラミング

C++はC言語の完全な上位互換ですが、オブジェクト指向型という点でC言語とは全く違うプログラミング思想に基づいています。簡単に言うと、JavaはC++の(思想の)利点を活かせるように新開発された言語です。

このページでは、C++の基本原則を書いています。より細かいプログラミングテクニックやサンプルプログラムがTipsのページにもあります。

マクロ, inlineの利用

C言語でマクロが果たしていた役割を、C++ではinline関数を用いて実現できます。 関数定義を

inline int cmp(const char& x, const char& y)
{ if (x < y) return -1; else if (x > y) return 1; else return 0; }

と書いておくと、cmp(x,y)という呼び出しはコンパイル時に全てソース中に展開されます。 実行ファイルが大きくなるのは欠点ですが、処理速度を犠牲にせずに可読性が上がります。

ヘッダーファイル

利用する関数の型情報は.h.hhという拡張子を持つヘッダーファイルに記述し、それをプログラムの先頭で読み込みます。一番有名なヘッダーは<stdio.h><iostream>でしょう。

#include <stdio.h>

iostreamも以前は拡張子(.h)を付けてインクルードしていたのですが、標準化の際に付けないことが決まりました。なので以下のように書いてください。

#include <iostream>
using namespace std;

二行目のusing以下は、iostreamで定義される標準入出力 std::cin, std::cout を、std::というネームスペース名無しで利用するために記述します。 C++でCの入出力を使うには

#include <cstdio>

としてください。

ヘッダーファイルはクラスを定義するソースプログラム毎に用意します。ディレクトリ内に.c.cpp等のファイルと混在してくると面倒です。例えばinclというディレクトリを作り、その中にヘッダーを集めておくと便利でしょう。(コンパイル方法は後述。)

各ヘッダーファイルは、プログラム中で複数回読み込むとエラーになります。ヘッダーファイルの先頭に

#ifndef LIST_H
#define LIST_H
#include "iterator.h"
  :
#endif

のように、ifndefのおまじないを入れておきましょう。

ファイルの入出力

C++では入出力にオペレータ<<, >>を使います。

与えられたファイルを全て結合して表示する cat.cpp
#include <iostream>
#include <fstream>
#include <string>
#include <vector>
using namespace std;

int main(int argc, char *argv[])
  {
    vector<string> lines;
    string line;
    for(int i=1; i < argc; i++) {
      //argv[0]には実行ファイル名が入っている
      ifstream fin(argv[i], ios::in);
      if(!fin) {// 必ずエラーチェックを入れる
        cout << "Error: cannot open file(" << argv[i] << ")" << endl;
        exit(1);
      }
      while(getline(fin, line))
        lines.push_back(line);
      // fin.close(); ファイルはクローズしなくて良い。
    }
    for(vector<string>::iterator itr=lines.begin();
        itr != lines.end(); ++itr)
      cout << *itr << "\n";
  }

これは STL を使うプログラム例なのでファイルの中身をすべて vector の中にコピーしています。 (ファイルの内容を出力するためだけなら、こんなことをしてはいけません。)

クラス定義

クラスは以下のように定義します。

class class名 {
private:
   // 外からアクセスできない変数やメンバー関数
public:
   // 外からアクセス可能な変数やメンバー関数
};

C言語における構造体との主な違いはアクセス制限です。

クラスと構造体の違い

以下のようなC構造体を考えましょう。

struct list {
  char* name;
  struct list* next;
  struct list* prev;     
};

構造体を初期化するには、構造体用のメモリと名前のメモリをそれぞれ malloc しなくてはなりません。

  ...
  struct list *p;
  char* sampleName;
  ...
  if ((p = (struct list *) malloc(sizeof(struct list))) == NULL) {
    printf("malloc error\n"); exit(EXIT_FAILURE);
  }
  if (p->name = (char*) malloc(sizeof(char)*20)) == NULL {
    printf("malloc error\n"); exit(EXIT_FAILURE);
  }
  strcpy(p->name, sampleName);
  ...

これでは全てのユーザが構造体の中身を熟知していないと使えません。 とりわけ、nameに malloc が必要なことや、20文字で十分かという判断は面倒です。 そこでC++ではこれをクラスにします。

public class Node {
  string name;
  Node* next;
  Node* prev;

public:
  Node(string str) : name(str) { prev=next=NULL; } //コンストラクタ
  ~Node() {} //デストラクタ
  ...
  string getName() { return name; }
};

コンストラクタが、構造体の malloc に対応します。 Cにおける char* 型はできる限り STLの string で置き換えましょう。こうすると、文字列の長さを気にしなくてよくなります。 実際、上のクラスでも 20 という定数や malloc が消えています。

自分自身を参照するthis

クラスの中で、自分自身を参照するには this というポインタを使います。 つまり実体を参照する場合は *this になります。 このポインタはコピーコンストラクタを定義する際に出てきます。

public class Node {
  ...
  Node& Operator=(const Node& x)
    { name = x.name; next = x.next; prev = x.prev; return *this; }
  ...
}

最後に return *this; としている点に注意してください。 自分自身を戻り値として返し、その際に参照渡し(&)をしています。 メンバー変数をたとえば this->name と参照することもできます。 (ちなみに、上のオペレータ定義はポインタの値をNodeクラスから持ち出す「不適切なコード」です。実際にはこのようなコードをかくことは無いでしょう。)


STL

STLとは Standard Template Library の略でC++が標準でサポートするデータ構造ライブラリです。 使えるデータ構造がある場合は積極的に使いましょう。逆に、標準でサポートされないライブラリはあまり使わないようにしましょう。

できる限りstringクラスを使う

単純な文字列でも、できる限りstringクラスを使いましょう。自分でchar*を使うのを避けましょう。以下は、それでもchar*を使いたい人に向けたヒントです。

  • 文字列は文字数+1の長さを宣言する。最後のnull文字分を忘れないように。
  • 文字列のメモリはcallocで確保する。callocはmallocした後に0で初期化するのと同じです。
  • strncpy, strncmpを利用する。strcpyやstrcmpはnull文字が出てくるまで処理を続けます。できる限り、処理する長さを自分で管理してください。

listはリスト、vectorは配列

STLでは、vectorクラスでも push_back 等の動的なサイズ変更が可能ですが、これははじめから余分にメモリを確保してあるためで、むやみに挿入や削除をすると効率が悪くなります。

イテレータを使う

STLにおいて配列、リスト、集合などのクラスはイテレータでスキャンすることができます。ポインタを用いて実装されています。

  vector<int> V;
  ...
  for(vector<int>::iterator I = V.begin(); I != V.end(); I++)
    cout << *I << ' ';

ここで終了条件が V.end()になっていることに注意してください。beginは最初の要素を返すメソッドですが、endは最後の要素の次を返すメソッドです。


メモリ管理

コンストラクタとデストラクタ

C++のクラス定義では、例えば以下のような記述をします。

class list_node;
typedef list_node* lnode;

class list_node {
private:
  list_node(const list_node&);
  list_node& operator=(const list_node&);
public:
  void* key;
  lnode list_pred;
  lnode list_succ;
  list_node(GenPtr x=0x0) : key(x), list_pred(0), list_succ(0) {}
  ~list_node() {}
};

この中でlist_node(GenPtr x=0x0)とあるのがコンストラクタ、~list_node()がデストラクタで、それぞれクラスのインスタンス生成、消去時に呼び出されます。コンストラクタ内ではクラス変数の初期化、デストラクタ内では必要なくなったポインタのnull化などをしておくと良いでしょう。(後者は無駄に思えるかもしれませんが、バグをなくすのに役立ちます。)

コピーコンストラクタと演算子のオーバーロード

上の例でprivate指定でアクセス制限されているのが、コピーコンストラクタlist_node(const list_node&)と演算子=の定義list_node& operator=(const list_node&)になります。 コピーコンストラクタは、

list_node x = 既に定義されているlist_nodeクラス;

と=をつけて初期化する場合と、関数にクラスを(参照渡しではなく)値渡しするときに実行されます。 また、演算子=のほうは、

list_node x,y;
x = y = 既に定義されているlist_nodeクラス;

と書かれたときに実行されます。上の例では、list_nodeクラスがユーザに無闇にコピーされることを防ぐためにprivate指定にしています。

new と delete

Cにおけるmalloc/freeと、new/deleteは同じではありません。 クラスのnew/deleteでは、コンストラクタとデストラクタが呼ばれることに注意しましょう。 基本データ型のnew/deleteは、基本的にmalloc/freeと同じですが、void*しか返さないmallocに比較して型キャストの必要がありません。

ですから、C++らしいプログラムを心がけるには、常にnew/deleteを使うと良いでしょう。

働きの全く同じ二つの例
char** cArray = new char*[10];
delete[] cArray;

char** cArray2 = (char**) malloc(sizeof(char*)*10);
free(cArray2);

Garbage Collection

Javaとの最大の違いは、メモリ管理を自分で行う点です。これは単に「遅れている」という訳ではなく、実時間プログラミングのようなGarbage collector(GC)が致命的となる場合にも使える「汎用性」と捉えましょう。C++の人が GC を使う際には Boost Library にある boost::shared_ptr を使うのが良いでしょう。

Shared_ptr の仕組については、Scott Myersの教科書"Effective C++"を読んでください。私自身が昔Cppプログラマだった頃は Boehm Collectorをよく使いました(笑)。

Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox