scikit-learn · bdholt1 · Aug 8, 2011 · Aug 19, 2011 · Sep 3, 2011 · Sep 3, 2011
diff --git a/README.rst b/README.rst
@@ -5,16 +5,16 @@ Collection of benchmarks comparing various python-based machine
 learning packages.
 
 This is meant to work with the development version of the libraries
-scikits.learn, mlpy, pybrain, pymvpa, mdp and shogun. It might be hard
-to get all packages working on the same machine, but benchmarks are
-designed so that if something fail it will just print the exception
-and go to the next one.
+scikits.learn, mlpy, pybrain, pymvpa, mdp, shogun, milk and orange. It 
+might be hard to get all packages working on the same machine, but 
+benchmarks are designed so that if something fail it will just print 
+the exception and go to the next one.
 
 To execute a benchmark, just type from the prompt::
 
     $ python benchmarks/bench_$name.py
 
-and you will se as output the mean and std deviation for the timing of
+and you will see as output the mean and standard deviation for the timing of
 running the benchmark 10 times with its extreme values removed.
 
 Results
@@ -43,6 +43,7 @@ References
   - Shogun: http://www.shogun-toolbox.org/
   - PyBrain : http://pybrain.org/
   - Milk : http://luispedro.org/software/milk
+  - Orange : http://orange.biolab.si/
 
 
 Misc

diff --git a/benchmarks/bench_elasticnet.py b/benchmarks/bench_elasticnet.py
@@ -69,17 +69,17 @@ def bench_pymvpa(X, y, T, valid):
 
     print 'Loading data ...'
     data = misc.load_data(dataset)
+
     print 'Done, %s samples with %s features loaded into ' \
-          'memory' % data[0].shape
+      'memory\n' % data[0].shape
+
+    score, res = misc.bench(bench_skl, data)
+    misc.print_result("elasticnet", dataset, "scikits.learn", score, res) 
 
-    score, res_skl = misc.bench(bench_skl, data)
-    print 'scikits.learn: mean %s, std %s' % (res_skl.mean(), res_skl.std())
-    print 'MSE ', score
+    score, res = misc.bench(bench_mlpy, data)
+    misc.print_result("elasticnet", dataset, "MLPy", score, res)     
 
-    score, res_mlpy = misc.bench(bench_mlpy, data)
-    print 'MLPy: mean %s, std %s' % (res_mlpy.mean(), res_mlpy.std())
-    print 'MSE ', score
+    score, res = misc.bench(bench_pymvpa, data)
+    misc.print_result("elasticnet", dataset, "PyMVPA", score, res)      
 
-    score, res_pymvpa = misc.bench(bench_pymvpa, data)
-    print 'PyMVPA: mean %s, std %s' % (res_pymvpa.mean(), res_pymvpa.std())
-    print 'MSE ', score
+    misc.save_results()
diff --git a/benchmarks/bench_kmeans.py b/benchmarks/bench_kmeans.py
@@ -119,34 +119,24 @@ def bench_milk(X, y, T, valid):
     data = misc.load_data(dataset)
 
     print 'Done, %s samples with %s features loaded into ' \
-      'memory' % data[0].shape
-
-    score, res_shogun = misc.bench(bench_shogun, data)
-    print 'Shogun: mean %.2f, std %.2f' % (
-        np.mean(res_shogun), np.std(res_shogun))
-    print 'Score: %2f\n' % score
-
-    score, res_mdp = misc.bench(bench_mdp, data)
-    print 'MDP: mean %.2f, std %.2f' % (
-        np.mean(res_mdp), np.std(res_mdp))
-    print 'Score: %2f\n' % score
-
-    score, res_skl = misc.bench(bench_skl, data)
-    print 'scikits.learn: mean %.2f, std %.2f' % (
-        np.mean(res_skl), np.std(res_skl))
-    print 'Score: %2f\n' % score
-
-    score, res_mlpy = misc.bench(bench_mlpy, data)
-    print 'MLPy: mean %.2f, std %.2f' % (
-        np.mean(res_mlpy), np.std(res_mlpy))
-    print 'Score: %2f\n' % score
-
-    score, res_pybrain = misc.bench(bench_pybrain, data)
-    print 'Pybrain: mean %.2f, std %.2f' % (
-        np.mean(res_pybrain), np.std(res_pybrain))
-    print 'Score: %2f\n' % score
-
-    score, res_milk = misc.bench(bench_milk, data)
-    print 'milk: mean %.2f, std %.2f' % (
-        np.mean(res_milk), np.std(res_milk))
-    print 'Score: %2f\n' % score
+      'memory\n' % data[0].shape
+
+    score, res = misc.bench(bench_shogun, data)
+    misc.print_result("kmeans", dataset, "Shogun", score, res)
+
+    score, res = misc.bench(bench_mdp, data)
+    misc.print_result("kmeans", dataset, "MDP", score, res)
+
+    score, res = misc.bench(bench_skl, data)
+    misc.print_result("kmeans", dataset, "scikits.learn", score, res)
+
+    score, res = misc.bench(bench_mlpy, data)
+    misc.print_result("kmeans", dataset, "MLPy", score, res)
+
+    score, res = misc.bench(bench_pybrain, data)
+    misc.print_result("kmeans", dataset, "Pybrain", score, res)
+
+    score, res = misc.bench(bench_milk, data)
+    misc.print_result("kmeans", dataset, "milk", score, res)
+
+    misc.save_results()
diff --git a/benchmarks/bench_knn.py b/benchmarks/bench_knn.py
@@ -107,28 +107,24 @@ def bench_milk(X, y, T, valid):
     data = misc.load_data(dataset)
 
     print 'Done, %s samples with %s features loaded into ' \
-      'memory' % data[0].shape
+      'memory\n' % data[0].shape
 
-    score, res_shogun = misc.bench(bench_shogun, data)
-    print 'Shogun: mean %.2f, std %.2f\n' % (res_shogun.mean(), res_shogun.std())
-    print 'Score: %.2f' % score
+    score, res = misc.bench(bench_shogun, data)
+    misc.print_result("knn", dataset, "Shogun", score, res)
 
-    score, res_mdp = misc.bench(bench_mdp, data)
-    print 'MDP: mean %.2f, std %.2f\n' % (res_mdp.mean(), res_mdp.std())
-    print 'Score: %.2f' % score
+    score, res = misc.bench(bench_mdp, data)
+    misc.print_result("knn", dataset, "MDP", score, res)
 
-    score, res_skl = misc.bench(bench_skl, data)
-    print 'scikits.learn: mean %.2f, std %.2f\n' % (res_skl.mean(), res_skl.std())
-    print 'Score: %.2f' % score
+    score, res = misc.bench(bench_skl, data)
+    misc.print_result("knn", dataset, "scikits.learn", score, res)
 
-    score, res_mlpy = misc.bench(bench_mlpy, data)
-    print 'MLPy: mean %.2f, std %.2f\n' % (res_mlpy.mean(), res_mlpy.std())
-    print 'Score: %.2f' % score
+    score, res = misc.bench(bench_mlpy, data)
+    misc.print_result("knn", dataset, "MLPy", score, res)
 
-    score, res_milk = misc.bench(bench_milk, data)
-    print 'milk: mean %.2f, std %.2f\n' % (res_milk.mean(), res_milk.std())
-    print 'Score: %.2f' % score
+    score, res = misc.bench(bench_pymvpa, data)
+    misc.print_result("knn", dataset, "PyMVPA", score, res)
 
-    score, res_pymvpa = misc.bench(bench_pymvpa, data)
-    print 'PyMVPA: mean %.2f, std %.2f\n' % (res_pymvpa.mean(), res_pymvpa.std())
-    print 'Score: %.2f' % score
+    score, res = misc.bench(bench_milk, data)
+    misc.print_result("knn", dataset, "milk", score, res)
+
+    misc.save_results()
diff --git a/benchmarks/bench_lassolars.py b/benchmarks/bench_lassolars.py
@@ -66,19 +66,15 @@ def bench_pymvpa(X, y, T, valid):
     data = misc.load_data(dataset)
 
     print 'Done, %s samples with %s features loaded into ' \
-      'memory' % data[0].shape
-
-    score, res_skl = misc.bench(bench_skl, data)
-    print 'scikits.learn: mean %.2f, std %.2f' % (
-        np.mean(res_skl), np.std(res_skl))
-    print 'MSE: %s\n' % score
-
-    score, res_mlpy = misc.bench(bench_mlpy, data)
-    print 'MLPy: mean %.2f, std %.2f' % (
-        np.mean(res_mlpy), np.std(res_mlpy))
-    print 'MSE: %s\n' % score
-
-    score, res_pymvpa = misc.bench(bench_pymvpa, data)
-    print 'PyMVPA: mean %.2f, std %.2f' % (
-        np.mean(res_pymvpa), np.std(res_pymvpa))
-    print 'MSE: %s\n' % score
+      'memory\n' % data[0].shape
+
+    score, res = misc.bench(bench_skl, data)
+    misc.print_result("lassolars", dataset, "scikits.learn", score, res)
+
+    score, res = misc.bench(bench_mlpy, data)
+    misc.print_result("lassolars", dataset, "MLPy", score, res)
+
+    score, res = misc.bench(bench_pymvpa, data)
+    misc.print_result("lassolars", dataset, "PyMVPA", score, res)
+
+    misc.save_results()
diff --git a/benchmarks/bench_logistic.py b/benchmarks/bench_logistic.py
@@ -36,8 +36,9 @@ def bench_skl(X, y, T, valid):
     data = misc.load_data(dataset)
 
     print 'Done, %s samples with %s features loaded into ' \
-      'memory' % data[0].shape
+      'memory\n' % data[0].shape
 
-    res_skl = misc.bench(bench_skl, data)
-    print 'MLPy: mean %.2f, std %.2f\n' % (
-        np.mean(res_skl), np.std(res_skl))
+    score, res = misc.bench(bench_skl, data)
+    misc.print_result("logistic", dataset, "scikits.learn", score, res)
+
+    misc.save_results()
diff --git a/benchmarks/bench_pca.py b/benchmarks/bench_pca.py
@@ -107,28 +107,19 @@ def bench_milk(X, y, T, valid):
     print 'Done, %s samples with %s features loaded into ' \
       'memory' % data[0].shape
 
-    score, res_mdp = misc.bench(bench_mdp, data)
-    print 'MDP: mean %s, std %s' % (
-        np.mean(res_mdp), np.std(res_mdp))
-    print 'Explained variance: %s\n'% score
-
-    score, res_skl = misc.bench(bench_skl, data)
-    print 'scikits.learn: mean %.2f, std %.2f' % (
-        np.mean(res_skl), np.std(res_skl))
-    print 'Explained variance: %s\n'% score
-
-    score, res_pybrain = misc.bench(bench_pybrain, data)
-    print 'Pybrain: mean %s, std %s' % (
-        np.mean(res_pybrain), np.std(res_pybrain))
-    print 'Explained variance: %s\n'% score
-
-    score, res_milk = misc.bench(bench_milk, data)
-    print 'milk: mean %s, std %s' % (
-        np.mean(res_milk), np.std(res_milk))
-    print 'Explained variance: %s\n'% score
-
-    score, res_pymvpa = misc.bench(bench_pymvpa, data)
-    print 'PyMVPA: mean %s, std %s' % (
-        np.mean(res_pymvpa), np.std(res_pymvpa))
-    print 'Explained variance: %s\n'% score
+    score, res = misc.bench(bench_mdp, data)
+    misc.print_result("pca", dataset, "MDP", score, res)
 
+    score, res = misc.bench(bench_skl, data)
+    misc.print_result("pca", dataset, "scikits.learn", score, res)
+
+    score, res = misc.bench(bench_pymvpa, data)
+    misc.print_result("pca", dataset, "PyMVPA", score, res)
+
+    score, res = misc.bench(bench_pybrain, data)
+    misc.print_result("pca", dataset, "Pybrain", score, res)
+
+    score, res = misc.bench(bench_milk, data)
+    misc.print_result("pca", dataset, "milk", score, res)
+
+    misc.save_results()
diff --git a/benchmarks/bench_svm.py b/benchmarks/bench_svm.py
@@ -172,44 +172,30 @@ def bench_orange(X, y, T, valid):
     sigma = np.median(pdist(data[0]))
 
     print 'Done, %s samples with %s features loaded into ' \
-      'memory' % data[0].shape
-
-    score, res_shogun = misc.bench(bench_shogun, data)
-    print 'Shogun: mean %.2f, std %.2f' % (
-        np.mean(res_shogun), np.std(res_shogun))
-    print 'Score: %.2f\n' % score
-
-    score, res_mdp = misc.bench(bench_mdp, data)
-    print 'MDP: mean %.2f, std %.2f' % (
-        np.mean(res_mdp), np.std(res_mdp))
-    print 'Score: %.2f\n' % score
-
-    score, res_skl = misc.bench(bench_skl, data)
-    print 'scikits.learn: mean %.2f, std %.2f' % (
-        np.mean(res_skl), np.std(res_skl))
-    print 'Score: %.2f\n' % score
-
-    score, res_mlpy = misc.bench(bench_mlpy, data)
-    print 'MLPy: mean %.2f, std %.2f' % (
-        np.mean(res_mlpy), np.std(res_mlpy))
-    print 'Score: %.2f\n' % score
-
-    score, res_pymvpa = misc.bench(bench_pymvpa, data)
-    print 'PyMVPA: mean %.2f, std %.2f' % (
-        np.mean(res_pymvpa), np.std(res_pymvpa))
-    print 'Score: %.2f\n' % score
-
-    score, res_pybrain = misc.bench(bench_pybrain, data)
-    print 'Pybrain: mean %.2f, std %.2f' % (
-        np.mean(res_pybrain), np.std(res_pybrain))
-    print 'Score: %.2f\n' % score
-
-    score, res_milk = misc.bench(bench_milk, data)
-    print 'milk: mean %.2f, std %.2f' % (
-        np.mean(res_milk), np.std(res_milk))
-    print 'Score: %.2f\n' % score
-
-    score, res_orange = misc.bench(bench_orange, data)
-    print 'Orange: mean %.2f, std %.2f' % (
-        np.mean(res_orange), np.std(res_orange))
-    print 'Score: %.2f\n' % score
+      'memory\n' % data[0].shape
+
+    score, res = misc.bench(bench_shogun, data)
+    misc.print_result("svm", dataset, "Shogun", score, res)
+
+    score, res = misc.bench(bench_mdp, data)
+    misc.print_result("svm", dataset, "MDP", score, res)
+
+    score, res = misc.bench(bench_skl, data)
+    misc.print_result("svm", dataset, "scikits.learn", score, res)
+
+    score, res = misc.bench(bench_mlpy, data)
+    misc.print_result("svm", dataset, "MLPy", score, res)
+
+    score, res = misc.bench(bench_pymvpa, data)
+    misc.print_result("svm", dataset, "PyMVPA", score, res)
+
+    score, res = misc.bench(bench_pybrain, data)
+    misc.print_result("svm", dataset, "Pybrain", score, res)
+
+    score, res = misc.bench(bench_milk, data)
+    misc.print_result("svm", dataset, "milk", score, res)
+
+    score, res = misc.bench(bench_orange, data)
+    misc.print_result("svm", dataset, "Orange", score, res)
+
+    misc.save_results()