Source code for ztlearn.dl.layers.pooling

# -*- coding: utf-8 -*-

import numpy as np

from .base import Layer
from ztlearn.utils import get_pad
from ztlearn.utils import im2col_indices
from ztlearn.utils import col2im_indices
from ztlearn.utils import get_output_dims


[docs]class Pool(Layer):

    def __init__(self, pool_size = (2, 2), strides = (1, 1), padding = 'valid'):
        self.pool_size = pool_size
        self.strides   = strides
        self.padding   = padding

        self.is_trainable = True

    @property
    def trainable(self):
        return self.is_trainable

    @trainable.setter
    def trainable(self, is_trainable):
        self.is_trainable = is_trainable

    @property
    def output_shape(self):
        input_channels, input_height, input_width = self.input_shape

        self.pad_height, self.pad_width = get_pad(self.padding,
                                                                input_height,
                                                                input_width,
                                                                self.strides[0],
                                                                self.strides[1],
                                                                self.pool_size[0],
                                                                self.pool_size[1])

        output_height, output_width = get_output_dims(input_height, input_width, self.pool_size, self.strides, self.padding)

        assert output_height % 1 == 0
        assert output_width % 1  == 0

        return input_channels, int(output_height), int(output_width)

[docs]    def prep_layer(self): pass

[docs]    def pass_forward(self, inputs, train_mode = True, **kwargs):
        input_num, input_depth, input_height, input_width = inputs.shape
        self.inputs = inputs

        assert (input_height - self.pool_size[0]) % self.strides[0] == 0, 'Invalid height'
        assert (input_width  - self.pool_size[1]) % self.strides[1] == 0, 'Invalid width'

        output_height, output_width = get_output_dims(input_height, input_width, self.pool_size, self.strides)

        input_reshaped = inputs.reshape(input_num * input_depth, 1, input_height, input_width)
        self.input_col = im2col_indices(input_reshaped,
                                                        self.pool_size[0],
                                                        self.pool_size[1],
                                                        padding = (self.pad_height, self.pad_width),
                                                        stride  = self.strides[0])

        output, self.pool_cache = self.pool_forward(self.input_col)

        output = output.reshape(int(output_height), int(output_width), input_num, input_depth)

        return output.transpose(2, 3, 0, 1)

[docs]    def pass_backward(self, grad, epoch_num, batch_num, batch_size):
        input_num, input_depth, input_height, input_width = self.inputs.shape

        d_input_col = np.zeros_like(self.input_col)
        grad_col    = grad.transpose(2, 3, 0, 1).ravel()

        d_input_col = self.pool_backward(d_input_col, grad_col, self.pool_cache)
        d_input     = col2im_indices(d_input_col,
                                                  (input_num * input_depth, 1, input_height, input_width),
                                                  self.pool_size[0],
                                                  self.pool_size[1],
                                                  padding = (self.pad_height, self.pad_width),
                                                  stride  = self.strides[0])

        return d_input.reshape(self.inputs.shape)


[docs]class MaxPooling2D(Pool):

    def __init__(self, pool_size = (2, 2), strides = (1, 1), padding = 'valid'):
        super(MaxPooling2D, self).__init__(pool_size, strides, padding)

[docs]    def pool_forward(self, input_col):
        max_id = np.argmax(input_col, axis = 0)
        out    = input_col[max_id, range(max_id.size)]

        return out, max_id

[docs]    def pool_backward(self, d_input_col, grad_col, pool_cache):
        d_input_col[pool_cache, range(grad_col.size)] = grad_col

        return d_input_col


[docs]class AveragePool2D(Pool):

    def __init__(self, pool_size = (2, 2), strides = (1, 1), padding = 'valid'):
        super(AveragePool2D, self).__init__(pool_size, strides, padding)

[docs]    def pool_forward(self, input_col):
        out = np.mean(input_col, axis = 0)

        return out, None

[docs]    def pool_backward(self, d_input_col, grad_col, pool_cache = None):
        d_input_col[:, range(grad_col.size)] = 1. / d_input_col.shape[0] * grad_col

        return d_input_col