tests/benchmark_sets_test.py

# Copyright 2018 PerfKitBenchmarker Authors. All rights reserved.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#   http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

"""Tests for perfkitbenchmarker.benchmark_sets."""

import unittest
from absl import flags
import mock

from perfkitbenchmarker import benchmark_sets
from perfkitbenchmarker import configs
from perfkitbenchmarker import linux_benchmarks
# This import to ensure required FLAGS are defined.
from perfkitbenchmarker import pkb  # NOQA

import six
import yaml

FLAGS = flags.FLAGS
FLAGS.mark_as_parsed()

USER_CONFIG = """
internal_iprf:
  name: iperf
  flags:
    ip_addresses: INTERNAL
"""
MATRIX_CONFIG = """
netperf:
  flag_matrix: GCP
  flag_matrix_defs:
    GCP:
      machine_type: [n1-standard-1, n1-standard-4]
      zones: [us-central1-a, us-central1-b]
"""
EXPECTED_MATRIX_FLAGS = [
    {'machine_type': 'n1-standard-1', 'zones': 'us-central1-a'},
    {'machine_type': 'n1-standard-1', 'zones': 'us-central1-b'},
    {'machine_type': 'n1-standard-4', 'zones': 'us-central1-a'},
    {'machine_type': 'n1-standard-4', 'zones': 'us-central1-b'}
]
ZIP_CONFIG_DIFFERENT_AXES_LENGTH = """
netperf:
  flags:
    gpu_type: k80
  flag_zip: GCP
  flag_zip_defs:
    GCP:
      machine_type: [n1-standard-4, n1-standard-8]
      gpu_count: [1, 2, 3]
"""
ZIP_CONFIG = """
netperf:
  flags:
    gpu_type: k80
  flag_zip: GCP
  flag_zip_defs:
    GCP:
      machine_type: [n1-standard-4, n1-standard-8]
      gpu_count: [1, 2]
"""
EXPECTED_ZIP_FLAGS = [
    {'machine_type': 'n1-standard-4', 'gpu_count': 1, 'gpu_type': 'k80'},
    {'machine_type': 'n1-standard-8', 'gpu_count': 2, 'gpu_type': 'k80'}
]
SINGLE_ZIP_CONFIG = """
netperf:
  flags:
    gpu_type: k80
  flag_zip: GCP
  flag_zip_defs:
    GCP:
      machine_type: [n1-standard-4, n1-standard-8]
"""
EXPECTED_SINGLE_ZIP_FLAGS = [
    {'machine_type': 'n1-standard-4', 'gpu_type': 'k80'},
    {'machine_type': 'n1-standard-8', 'gpu_type': 'k80'}
]
ZIP_AND_MATRIX_CONFIG = """
netperf:
  flags:
    gpu_type: k80
  flag_zip: GCP
  flag_matrix: GCP
  flag_zip_defs:
    GCP:
      machine_type: [n1-standard-4, n1-standard-8]
      gpu_count: [1, 2]
  flag_matrix_defs:
    GCP:
      zones: [us-central1-a, us-central1-b]
"""
EXPECTED_ZIP_AND_MATRIX_FLAGS = [
    {'zones': 'us-central1-a', 'gpu_type': 'k80',
     'machine_type': 'n1-standard-4', 'gpu_count': 1},
    {'zones': 'us-central1-b', 'gpu_type': 'k80',
     'machine_type': 'n1-standard-4', 'gpu_count': 1},
    {'zones': 'us-central1-b', 'gpu_type': 'k80',
     'machine_type': 'n1-standard-8', 'gpu_count': 2},
    {'zones': 'us-central1-a', 'gpu_type': 'k80',
     'machine_type': 'n1-standard-8', 'gpu_count': 2}
]
FILTER_CONFIG = """
netperf:
  flag_matrix: GCP
  flag_matrix_filters:
    GCP: "machine_type == 'n1-standard-1' and zones == 'us-central1-a'"
  flag_matrix_defs:
    GCP:
      machine_type: [n1-standard-1, n1-standard-4]
      zones: [us-central1-a, us-central1-b]
"""
FLAG_PRECEDENCE_CONFIG = """
flags:
  netperf_benchmarks: TCP_RR
  netperf_test_length: 30
  netperf_max_iter: 3
netperf:
  flags:
    netperf_benchmarks: UDP_RR
    netperf_test_length: 40
  flag_matrix: test_matrix
  flag_matrix_defs:
    test_matrix:
      netperf_benchmarks: [TCP_STREAM]
"""


class BenchmarkSetsTestCase(unittest.TestCase):

  def setUp(self):
    # create set of valid benchmark names from the benchmark directory
    self.valid_benchmark_names = set()
    for benchmark_module in linux_benchmarks.BENCHMARKS:
      self.valid_benchmark_names.add(benchmark_module.BENCHMARK_NAME)

    self.valid_benchmark_set_names = set()
    # include the benchmark_set names since these can also appear
    # as a valid name.  At runtime they get expanded.
    for benchmark_set_name in benchmark_sets.BENCHMARK_SETS:
      self.valid_benchmark_set_names.add(benchmark_set_name)

    # Mock flags to simulate setting --benchmarks.
    p = mock.patch(benchmark_sets.__name__ + '.FLAGS')
    self.mock_flags = p.start()
    self.addCleanup(p.stop)
    self.addCleanup(configs.GetConfigFlags.cache_clear)

    self.mock_flags.flag_matrix = None
    self.mock_flags.flag_zip = None
    self.mock_flags.num_benchmark_copies = 1

  def testStandardSet(self):
    self.assertIn(benchmark_sets.STANDARD_SET, benchmark_sets.BENCHMARK_SETS)
    standard_set = (benchmark_sets.BENCHMARK_SETS[
                    benchmark_sets.STANDARD_SET])[benchmark_sets.BENCHMARK_LIST]
    self.assertIn('iperf', standard_set)
    self.assertIn('fio', standard_set)

  def testBenchmarkSetsHaveValidNames(self):
    # check all the benchmark sets to make sure they contain valid names
    valid_benchmark_and_set_names = (self.valid_benchmark_names |
                                     self.valid_benchmark_set_names)
    benchmark_set_items = list(benchmark_sets.BENCHMARK_SETS.items())
    for _, key_value in benchmark_set_items:
      benchmark_def_list = key_value[benchmark_sets.BENCHMARK_LIST]
      for benchmark_name in benchmark_def_list:
        self.assertIn(benchmark_name, valid_benchmark_and_set_names)

  def testBenchmarkDerivedSets(self):
    # make sure that sets which are derived from the standard_set
    # expands into a valid set of benchmarks
    with mock.patch.dict(
        benchmark_sets.BENCHMARK_SETS, {
            'test_derived_set': {
                benchmark_sets.MESSAGE: 'test derived benchmark set.',
                benchmark_sets.BENCHMARK_LIST: [benchmark_sets.STANDARD_SET]
            }
        }):
      self.mock_flags.benchmarks = ['test_derived_set']
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
      self.assertIsNotNone(benchmark_tuple_list)
      self.assertGreater(len(benchmark_tuple_list), 0)
      for benchmark_tuple in benchmark_tuple_list:
        self.assertIn(benchmark_tuple[0].BENCHMARK_NAME,
                      self.valid_benchmark_names)

  def testBenchmarkNestedDerivedSets(self):
    # make sure that sets which are derived from the standard_set
    # expands into a valid set of benchmarks
    self.mock_flags.benchmarks = [benchmark_sets.STANDARD_SET]
    standard_module_list = benchmark_sets.GetBenchmarksFromFlags()
    with mock.patch.dict(
        benchmark_sets.BENCHMARK_SETS, {
            'test_derived_set': {
                benchmark_sets.MESSAGE: 'test derived benchmark set.',
                benchmark_sets.BENCHMARK_LIST: [benchmark_sets.STANDARD_SET]
            },
            'test_nested_derived_set': {
                benchmark_sets.MESSAGE: 'test nested derived benchmark set.',
                benchmark_sets.BENCHMARK_LIST: ['test_derived_set']
            }
        }):
      # TODO(voellm): better check would be to make sure both lists are the same
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
      self.assertIsNotNone(benchmark_tuple_list)
      self.assertIsNotNone(standard_module_list)
      self.assertEqual(len(benchmark_tuple_list), len(standard_module_list))
      for benchmark_tuple in benchmark_tuple_list:
        self.assertIn(benchmark_tuple[0].BENCHMARK_NAME,
                      self.valid_benchmark_names)

  def testBenchmarkValidCommandLine1(self):
    # make sure the standard_set expands to a valid set of benchmarks
    self.mock_flags.benchmarks = ['standard_set']
    benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertIsNotNone(benchmark_tuple_list)
    self.assertGreater(len(benchmark_tuple_list), 0)
    for benchmark_tuple in benchmark_tuple_list:
      self.assertIn(benchmark_tuple[0].BENCHMARK_NAME,
                    self.valid_benchmark_names)

  @staticmethod
  def _ContainsModule(module_name, module_list):
    for module_tuple in module_list:
      if module_tuple[0].BENCHMARK_NAME == module_name:
        return True
    return False

  def testBenchmarkValidCommandLine2(self):
    # make sure the standard_set plus a listed benchmark expands
    # to a valid set of benchmarks
    self.mock_flags.benchmarks = ['standard_set', 'bonnieplusplus']
    benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertIsNotNone(benchmark_tuple_list)
    self.assertGreater(len(benchmark_tuple_list), 0)
    for benchmark_tuple in benchmark_tuple_list:
      self.assertIn(benchmark_tuple[0].BENCHMARK_NAME,
                    self.valid_benchmark_names)
    # make sure bonnieplusplus is a listed benchmark
    self.assertTrue(self._ContainsModule('bonnieplusplus',
                                         benchmark_tuple_list))

  def testBenchmarkValidCommandLine3(self):
    # make sure the command with two benchmarks is processed correctly
    self.mock_flags.benchmarks = ['iperf', 'fio']
    benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertIsNotNone(benchmark_tuple_list)
    self.assertEqual(len(benchmark_tuple_list), 2)
    for benchmark_tuple in benchmark_tuple_list:
      self.assertIn(benchmark_tuple[0].BENCHMARK_NAME,
                    self.valid_benchmark_names)
    # make sure listed benchmarks are present
    self.assertTrue(self._ContainsModule('iperf', benchmark_tuple_list))
    self.assertTrue(self._ContainsModule('fio', benchmark_tuple_list))

  def testBenchmarkInvalidCommandLine1(self):
    # make sure invalid benchmark names and sets cause a failure
    self.mock_flags.benchmarks = ['standard_set_invalid_name']
    self.assertRaises(ValueError, benchmark_sets.GetBenchmarksFromFlags)

  def testBenchmarkInvalidCommandLine2(self):
    # make sure invalid benchmark names and sets cause a failure
    self.mock_flags.benchmarks = ['standard_set', 'iperf_invalid_name']
    self.assertRaises(ValueError, benchmark_sets.GetBenchmarksFromFlags)

  def testConfigNames(self):
    self.mock_flags.benchmarks = ['internal_iprf', 'netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(USER_CONFIG)):
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertTrue(self._ContainsModule('iperf', benchmark_tuple_list))
    self.assertTrue(self._ContainsModule('netperf', benchmark_tuple_list))

  def testMatrices(self):
    self.mock_flags.benchmarks = ['netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(MATRIX_CONFIG)):
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertEqual(len(benchmark_tuple_list), 4)
    flag_list = [benchmark_tuple[1]['flags']
                 for benchmark_tuple in benchmark_tuple_list]
    six.assertCountEqual(self, flag_list, EXPECTED_MATRIX_FLAGS)

  def testZipWithDifferentAxesLengths(self):
    self.mock_flags.benchmarks = ['netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(ZIP_CONFIG_DIFFERENT_AXES_LENGTH)):
      self.assertRaises(ValueError, benchmark_sets.GetBenchmarksFromFlags)

  def testZip(self):
    self.mock_flags.benchmarks = ['netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(ZIP_CONFIG)):
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertEqual(len(benchmark_tuple_list), 2)
    flag_list = [benchmark_tuple[1]['flags']
                 for benchmark_tuple in benchmark_tuple_list]
    six.assertCountEqual(self, flag_list, EXPECTED_ZIP_FLAGS)

  def testZipSingleAxis(self):
    self.mock_flags.benchmarks = ['netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(SINGLE_ZIP_CONFIG)):
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertEqual(len(benchmark_tuple_list), 2)
    flag_list = [benchmark_tuple[1]['flags']
                 for benchmark_tuple in benchmark_tuple_list]
    six.assertCountEqual(self, flag_list, EXPECTED_SINGLE_ZIP_FLAGS)

  def testZipAndMatrix(self):
    self.mock_flags.benchmarks = ['netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(ZIP_AND_MATRIX_CONFIG)):
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertEqual(len(benchmark_tuple_list), 4)
    flag_list = [benchmark_tuple[1]['flags']
                 for benchmark_tuple in benchmark_tuple_list]
    six.assertCountEqual(self, flag_list, EXPECTED_ZIP_AND_MATRIX_FLAGS)

  def testFilters(self):
    self.mock_flags.benchmarks = ['netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(FILTER_CONFIG)):
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertEqual(len(benchmark_tuple_list), 1)
    self.assertEqual(benchmark_tuple_list[0][1]['flags'],
                     {'zones': 'us-central1-a',
                      'machine_type': 'n1-standard-1'})

  def testFlagPrecedence(self):
    self.mock_flags.benchmarks = ['netperf']
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(FLAG_PRECEDENCE_CONFIG)):
      benchmark_tuple_list = benchmark_sets.GetBenchmarksFromFlags()
    self.assertEqual(len(benchmark_tuple_list), 1)
    self.assertEqual(benchmark_tuple_list[0][1]['flags'],
                     {'netperf_benchmarks': 'TCP_STREAM',
                      'netperf_test_length': 40,
                      'netperf_max_iter': 3})

  def testFlagMatrixNotFound(self):
    self.mock_flags.benchmarks = ['netperf']
    self.mock_flags.flag_matrix = 'bad_flag_matrix_name'
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(USER_CONFIG)):
      with self.assertRaises(benchmark_sets.FlagMatrixNotFoundException):
        benchmark_sets.GetBenchmarksFromFlags()

  def testFlagZipNotFound(self):
    self.mock_flags.benchmarks = ['netperf']
    self.mock_flags.flag_zip = 'bad_flag_zip_name'
    with mock.patch(
        'perfkitbenchmarker.configs.GetUserConfig',
        return_value=yaml.safe_load(USER_CONFIG)):
      with self.assertRaises(benchmark_sets.FlagZipNotFoundException):
        benchmark_sets.GetBenchmarksFromFlags()


if __name__ == '__main__':
  unittest.main()